أفيريس: حل معضلة خصوصية البيانات

يونيو 2022

بقلم جيمس نارتون، كاتب مستقل

كيف يمكنك تمكين أدوات الذكاء الاصطناعي المتطورة مع احترام خصوصية الملكية الفكرية لأصول البيانات وحمايتها؟ تعتقد شركة ناشئة مقرها برلين أن التعلم المتحد يفي بالمطلوب.

يعتمد التعلم المتحد على الاعتقاد بأن "البيانات الحساسة من الأفضل أن تبقى
محلية وتحت سيطرة مراقب البيانات"، ويقدم نتائج "جيدة كما لو كانت جميع
البيانات موجودة على خوادم خاصة بك"، كما تقول لوسي أرنتز، رئيسة
الشؤون القانونية في شركة أفيريس. (الصورة: بإذن من شركة أفيريس)

وصف المدير العام للويبو دارين تانغ في كلمته الافتتاحية في الدورة الرابعة من محادثة الويبو بشأن الملكية الفكرية والتكنولوجيات الحدودية في سبتمبر 2021 (اقرأ البيانات: الوقود الذي يُغير وجه الاقتصاد العالمي) البيانات بأنها "الوقود" الذي يعزز الرقمنة. تتطلب خوارزميات التعلم الآلي كميات كبيرة من البيانات للتعلم منها، ولكن ماذا يحدث عندما ينقطع تدفق الوقود، بعبارة أخرى عندما لا يمكن مشاركة البيانات لأسباب تتعلق بالخصوصية أو الأمان أو حماية الملكية الفكرية؟

يُعرف أحد الحلول لهذه المشكلة باسم التعلم المتحد، حيث لا تخرج البيانات مطلقاً عن سيطرة مالك البيانات. بدلاً من ذلك، يتم تدريب خوارزميات التعلم الآلي على البيانات محلياً، دون مشاركتها مطلقاً. ومن الأمثلة البسيطة أنه يمكن استخدام البيانات الحساسة مثل سجلات المرضى من أحد المستشفيات في تطوير دواء جديد من جانب شركة أدوية دون أن يُضطر المستشفى إلى الكشف عن أي بيانات. وفي الحالات الأكثر تعقيداً، يمكن استخدام البيانات من مصادر متعددة لتدريب الخوارزمية نفسها، مما يحقق فوائد من حيث كل من الحجم والتنوع.

يتطلب التعلم المتحد طرفاً خارجياً موثوقاً به للجمع بين الخوارزمية ومالكي البيانات. شركة أفيريس الناشئة ومقرها برلين، والتي أُطلقت في عام 2019، هي إحدى هذه الشركات. لدى شركة أفيريس فريق مكون من 20 فرداً من المطورين والخبراء في الخصوصية وعلماء بيانات يوفرون منصة آمنة لمشاركة البيانات الآمنة. وتحدثت رئيسة الشؤون القانونية، لوسي أرنتز، مؤخراً إلى مجلة الويبو حول نموذج أعمال الشركة وحماية البيانات وأمنها.

فوائد التعلم المتحد

انضمت السيدة أرنتز إلى شركة أفيريس في صيف 2020، كأول موظف لم يكن عالماً، وهي مسؤولة عن ضمان وجود أساس قانوني مناسب وحماية حقوق العملاء والإشراف على العقود. تقول إن التعلم المتحد يعتمد على الاعتقاد بأن "البيانات الحساسة من الأفضل أن تبقى محلية وتحت سيطرة مراقب البيانات" وإنه يقدم نتائج "جيدة كما لو كانت جميع البيانات موجودة على خوادم خاصة بك".

حتى الآن، كانت الفوائد أكثر وضوحاً في قطاع الرعاية الصحية، حيث يتم تطوير تقنيات الذكاء الاصطناعي ويوجد شواغل أساسية بشأن بيانات المرضى السرية والحساسة. ولكن تشير السيدة أرنتز إلى أن التعلم المتحد يوفر فوائد حتى عندما لا تكون البيانات حساسة فيما يتعلق بمعلومات يمكن تحديدها بشكل شخصي (PII). وعلى سبيل المثال، تعمل أفيريس الآن على مشروع لشركة مصنعة لمواد كيميائية، والذي يتضمن بيانات المنتجات والعملاء التي تعتبر حساسة تجارياً وسرية. يمكن أن ينطبق التعلم المتحد أيضاً عندما تكون بعض البيانات محمية بموجب حقوق الملكية الفكرية.

وتقول السيدة أرنتز: "أصبحت البيانات المركزية قديمة"، وتضيف أن العديد من الشركات تمتلك كميات كبيرة من البيانات القيمة التي لا يتم الاستفادة منها بسبب شواغل بشأن المشاركة: "قد يكون لديك الكثير من البيانات التي قد تكون مهمة للغاية لشخص آخر ولكن غير مهمة لك، لذلك لا توجد قيمة لهذه البيانات مطلقاً دون الشراكة مع شخص ما".

في بعض الحالات، قد لا تظهر قيمة البيانات إلا عند دمجها مع بيانات من مصادر أخرى من خلال التعلم المتحد. فعلى سبيل المثال، يمكن استكمال البيانات الطبية من المرضى في الولايات المتحدة بتلك الواردة من أفريقيا أو آسيا، وينتج عن ذلك توفر مجموعة بيانات تجارب سريرية أكثر تنوعاً. وتقول السيدة أرنتز: "يمكنك توسيع نطاقها بقدر ما تريد وهذا ما يجعلها مذهلة".

لكنها تضيف أن إمكانات التعلم المتحد لا تزال أمامها ثلاث سنوات على الأرجح ليتم تحقيقها. ويكمن أحد أسباب ذلك في الحاجة إلى مزيد من التوحيد القياسي في جمع البيانات وتنسيقها. فما دامت زيادة قدرة الحوسبة تُمكّن من معالجة كميات أكبر من البيانات، يجب أن تكون البيانات منظمة بشكل جيد لتمكين التعاون الآمن للبيانات لتحقيق النتائج المُثلى. ويضطلع قطاع الرعاية الصحية بدور الريادة مجدداً، لكن القطاعات الأخرى في طريقها إلى اللحاق بالركب. وإحدى الصناعات التي تحددها السيدة أرنتز هي صناعة السيارات، حيث يعتمد تطوير المركبات ذاتية القيادة جزئياً وكلياً على تحليل مجموعة متنوعة للغاية من البيانات من مصادر مختلفة، ومنها السائقون والمركبات وهيئات الطرق السريعة ووكالات إنفاذ القانون وشركات التأمين. وتقول: "تركّز صناعة السيارات بشدة على وضع هذا التوحيد القياسي في محله. ويوجد اهتمام كبير بالقدرة على التعاون في هذه البيانات وهناك جهود لجمع الشركات المصنعة الكبرى معاً لإجراء التوحيد القياسي. فهو مجال مثير للاهتمام بشكل خاص لأنه يتضمن تفاعلاً بين القطاعين العام والخاص". وفي قطاع السيارات، من المرجح أن يكون الحل طوعياً تقوده الصناعة، ولكن الأمر سيستغرق وقتاً للتطوير.

في حين أن زيادة قدرة الحوسبة تُمكّن من معالجة كميات أكبر من البيانات، يجب أن تكون البيانات منظمة بشكل جيد لتمكين التعاون الآمن للبيانات لتحقيق النتائج المثلى.

معضلة إخفاء الهوية

يتمثل أحد التحديات الكبيرة لتطوير أدوات الذكاء الاصطناعي في مستوى إخفاء الهوية. فمن المفهوم اهتمام الأفراد بحماية بياناتهم الشخصية (سواء كان ذلك التاريخ الطبي أو العائلي أو المعلومات المالية أو التفاصيل الشخصية الأخرى)، ولكن، كما تقول السيدة أرنتز، "كلما زاد إخفاء هوية البيانات، قلّت أهميتها. فإخفاء الهوية ليس مستقبل التعلّم الآلي". وعلى سبيل المثال، يحتاج تطوير العقاقير واختبارها بشكل فعّال إلى مراعاة العمر والأصل العرقي والحساسية والأدوية وغيرها من العوامل؛ وتحتاج السيارات ذاتية القيادة إلى معلومات حول المكان الذي تتّجه إليه ونوع المركبة التي تقودها والسرعة التي تريد أن تصل إليها. وتعتقد السيدة أرنتز أن التعلم المتحد يمكن أن يساعد في توفير التوازن وإظهار أنه "ليس تعارضاً أن يكون لديك كل من الخصوصية والابتكار".

ويتطلب التغلب على مثل هذه التحديات مزيجاً من الحلول التكنولوجية والقانونية: يمكن للتكنولوجيا ضمان أمن البيانات من خلال عمليات صارمة ومختبرة بشكل مكثف، في حين يتيح القانون العقود التي تنص على من يتحكم في البيانات ومن يمكنه الحصول على النتائج ومستوى التفاصيل الذي يتلقاه.

مقارنة بين التعلم المركزي والمتحد

"تقول السيدة أرنتز: أصبحت البيانات المركزية قديمة. "قد يكون لديك الكثير من البيانات التي قد تكون مهمة للغاية لشخص آخر ولكن غير مهمة لك، لذلك لا توجد قيمة لهذه البيانات مطلقاً دون الشراكة مع شخص ما.”

تظل كيفية حماية البيانات في الواقع سؤالاً صعباً: في حين أن قانون حق المؤلف والأدوات الخاصة مثل حقوق قاعدة البيانات في الاتحاد الأوروبي قد توفر بعض الحماية، فإن الحدود ليست واضحة ومن المرجح أن تُفضل معظم المنظمات الحفاظ على أمن البيانات، والاعتماد على الأحكام التعاقدية والحماية بموجب الأسرار التجارية أو قوانين المعلومات السرية. لكن السيدة أرنتز تقول إن مسألة حماية البيانات وطريقة حمايتها لا يجب أن تمثل مشكلة: "إذا كانت لديك بيانات، فربما تعتقد أنها مهمة ويجب حمايتها. وبالنسبة للتعلم المتحد، لا يهم إذا ما كانت البيانات محمية بصورة رسمية أم لا. فنحن نلتزم بتوخي الحذر".

تعتقد أن المسألة الأكثر إلحاحاً هي "الموافقة واسعة النطاق". تقر اللائحة العامة لحماية البيانات أنه ليس من الممكن دائماً للباحثين العلميين تحديد جميع الأغراض التي يتم جمع البيانات من أجلها. لذلك، قد لا يتعين عليهم أن يكونوا محددين بشأن خططهم في المجالات الأخرى، ولكن مع ذلك ينبغي لهم توفير خيارات حتى تتمكن موضوعات البيانات من إعطاء موافقة مستنيرة لاستخدامات البحث المستقبلية. تقول: "نحن بحاجة إلى إرشادات أوضح حول ماهية "أغراض البحث". وفي الوقت الحالي، هناك حالة من عدم اليقين بالنسبة للجامعات والباحثين وهذا يحد من الابتكار".

تسليط الضوء على التنظيم العادل

تعتقد السيدة أرنتز أن اللائحة العامة لحماية البيانات هي مثال على التشريع الذي "يتعرض لانتقادات شديدة ولكنه أيضاً محبوب للغاية": فهي توفر أساساً سليماً لحماية البيانات ولكن يجب تحديثها مع تغير التكنولوجيا. "قبل كل شيء، نحتاج إلى الوضوح: حتى لو كان الإرشاد هو أنه لا يمكنك فعل شيء ما، فمن الجيد على الأقل أن يكون لديك حد واضح".

تقول أيضاً إن اللائحة العامة لحماية البيانات هي مثال على كيف يمكن للمنطقة، يقصد بذلك في هذه الحالة الاتحاد الأوروبي، "تسليط الضوء" لتعزيز التنظيم العادل: كما تقول، لا يمكن تنظيم البيانات على المستوى الوطني فحسب، لذا ثمة حاجة إلى حلول متعددة الجنسيات أو دولية، حتى لو كان يجب التوصل إلى حلول توفيقية خلال ذلك. إنها متفائلة بأن مبادرات الاتحاد الأوروبي الجديدة، مثل قانون حوكمة البيانات الذي تم اعتماده مؤخراً وقانون الذكاء الاصطناعي المقترح، ستوفر مزيداً من الوضوح: "يجب أن تكون السياسة منفتحة دوماً لأجل التحسين. سنحتاج إلى تكييفها في المستقبل وإعادة النظر فيما نحاول تحقيقه".

تمكن أفيريس الشركات من تحليل بيانات أطراف متعددة بأمان مع الحفاظ على خصوصية المعلومات مسجّلة الملكية.

ومع ذلك، فهي تحذر من أن العملية يجب أن تكون شاملة ومتعددة التخصصات: في كثير من الأحيان لا يكون خبراء الأعمال والقانون والسياسة والتكنولوجيا على وفاق أو حتى يتشاركون نفس الأفكار، ولا يُلتفت دوماً للشركات الناشئة والشركات الصغيرة والمتوسطة. تشرح السيدة أرنتز: "تتحدث الحكومات كثيراً مع الشركات الكبرى، لكن إذا لم تتحدث مع الشركات الناشئة، فلن تسمع عن التكنولوجيا المبتكرة".

وتقول إن المحادثة مهمة لأن التكنولوجيا تزداد تطوراً، ويوجد تمويل وفير متاح لمنتجات وخدمات جديدة مشتقة من الذكاء الاصطناعي وتحليل البيانات. تتضح أهمية البيانات في كل شيء بدءاً من معالجة جائحة كوفيد-19 إلى تقييم أثر تغيُّر المناخ. تقول السيدة أرنتز: "سنرى الكثير من النمو في تحليل البيانات، وسيتعين على السياسة أن تتحرك استجابة لذلك".

اللائحة العامة لحماية البيانات (GDPR): تحل اللائحة العامة لحماية البيانات لعام 2016 محل توجيه الاتحاد الأوروبي لحماية البيانات وتُنظم معالجة البيانات الشخصية لموضوعات البيانات في المنطقة الاقتصادية الأوروبية. تم اتباعها في العديد من البلدان والمناطق الأخرى، على سبيل المثال في قانون خصوصية المستهلك في كاليفورنيا (2018).

قانون حوكمة البيانات: : اعتمد البرلمان الأوروبي القانون في 6 أبريل 2022. وقد أعلن البرلمان الأوروبي أنها خطوة "ستحفز الابتكار وتساعد الشركات الناشئة والشركات على استخدام البيانات الضخمة". ستفيد القواعد الشركات من خلال خفض تكلفة البيانات وعوائق الدخول إلى السوق. سيستفيد المستهلكون، على سبيل المثال، من خلال النفاذ إلى استهلاك أكثر ذكاءً للطاقة وانبعاثات أقل. تم تصميم القواعد أيضاً لبناء الثقة من خلال تسهيل مشاركة البيانات وتأمينها عن طريق ضمان توافقها مع تشريعات حماية البيانات. ستيسر أيضاً إعادة استخدام فئات معينة من بيانات القطاع العام، وستزيد الثقة في وسطاء البيانات وتعزز إيثار البيانات (تبادل البيانات لصالح المجتمع). سينشئ القانون "العمليات والهياكل" لتسهيل مشاركة البيانات على الشركات والأفراد والقطاع العام. يجب أن تعتمده جميع بلدان الاتحاد الأوروبي في المجلس قبل أن يصبح قانوناً.

قانون بيانات الاتحاد الأوروبي: في فبراير 2022، اعتمدت المفوضية الأوروبية القانون، المعروف أيضاً باسم اللائحة المقترحة للقواعد المنسقة بشأن النفاذ العادل إلى البيانات واستخدامها، وهو ركيزة رئيسية لاستراتيجية البيانات الأوروبية. يوضح من يمكنه خلق قيمة من البيانات والظروف التي يمكن في ظلها القيام بذلك.

قانون الذكاء الاصطناعي: يعتبر الاقتراح الخاص بلائحة الذكاء الاصطناعي لوضع قواعد منسقة للاتحاد الأوروبي جزءاً من حزمة الذكاء الاصطناعي للمفوضية الأوروبية التي نُشرت في أبريل 2021. إنها المحاولة الأولى "لسن تنظيم أفقي للذكاء الاصطناعي"، وهي مصممة لتحويل أوروبا إلى مركز عالمي للذكاء الاصطناعي الجدير بالثقة والمتمحور حول الإنسان.

تحذير

الغرض من مجلة الويبو مساعدة عامة الجمهور على فهم الملكية الفكرية وعمل الويبو، وليست المجلة وثيقة من وثائق الويبو الرسمية. ولا يراد بالتسميات المستخدمة وبطريقة عرض المادة في هذا المنشور بأكمله أن تعبر عن أي رأي كان من جهة الويبو بشأن الوضع القانوني لأي بلد أو إقليم أو منطقة أو سلطاتها أو بشأن تعيين حدودها أو تخومها. ولا يراد بهذا المنشور أن يعبر عن آراء الدول الأعضاء أو أمانة الويبو. ولا يراد بذكر شركات أو منتجات صناعية محددة أن الويبو تؤيدها أو توصي بها على حساب شركات أو منتجات أخرى ذات طبيعة مماثلة وغير مذكورة.

أفيريس: حل معضلة خصوصية البيانات

فوائد التعلم المتحد

معضلة إخفاء الهوية

مقارنة بين التعلم المركزي والمتحد

تسليط الضوء على التنظيم العادل

البيانات في الاتحاد الأوروبي – الموجودة والمقترحة