كانت الموجة الأولى من أدوات الذكاء الاصطناعي التوليدي الرئيسية تعتمد في الأساس على البيانات “المتاحة للعامة” ــ أي شيء وكل شيء يمكن استخراجه من الإنترنت. والآن تعمل مصادر بيانات التدريب على تقييد الوصول إليها بشكل متزايد والدفع نحو اتفاقيات الترخيص. ومع تكثيف البحث عن مصادر بيانات إضافية، ظهرت شركات ناشئة جديدة في مجال الترخيص للحفاظ على تدفق المواد المصدرية.
وتريد مجموعة مقدمي خدمات البيانات، وهي مجموعة تجارية تأسست هذا الصيف، أن تجعل صناعة الذكاء الاصطناعي أكثر توحيدًا وإنصافًا. وتحقيقًا لهذه الغاية، أصدرت للتو ورقة موقف تحدد مواقفها بشأن القضايا الرئيسية المتعلقة بالذكاء الاصطناعي. ويتألف التحالف من سبع شركات ترخيص للذكاء الاصطناعي، بما في ذلك شركة Rightsify لإدارة حقوق التأليف والنشر الموسيقية، وسوق الصور الفوتوغرافية اليابانية Pixta، وشركة Calliope Networks الناشئة لترخيص حقوق التأليف والنشر للذكاء الاصطناعي التوليدي. (سيتم الإعلان عن خمسة أعضاء جدد على الأقل في الخريف).
وتدعو هيئة حماية البيانات إلى نظام اختياري، بمعنى أنه لا يمكن استخدام البيانات إلا بعد الحصول على موافقة صريحة من المبدعين وأصحاب الحقوق. ويمثل هذا انحرافًا كبيرًا عن الطريقة التي تعمل بها معظم شركات الذكاء الاصطناعي الكبرى. فقد طورت بعض الشركات أنظمة اختيارية خاصة بها، الأمر الذي يضع العبء على أصحاب البيانات لسحب أعمالهم على أساس كل حالة على حدة. ولا تقدم شركات أخرى أي خيارات اختيارية على الإطلاق.
وترى هيئة حماية البيانات، التي تتوقع من الأعضاء الالتزام بقاعدة الاشتراك الاختياري، أن هذا المسار هو الأكثر أخلاقية. ويقول أليكس بيستال، الرئيس التنفيذي لشركة Rightsify وشركة Global Copyright Exchange لترخيص بيانات الموسيقى، والذي قاد الجهود: “يجب أن يشارك الفنانون والمبدعون”. ويرى بيستال أن الاشتراك الاختياري هو نهج عملي وأخلاقي أيضًا: “إن بيع مجموعات البيانات المتاحة للجمهور هو أحد الطرق التي تؤدي إلى مقاضاة الشركات وعدم اكتساب المصداقية”.
ويصف إيد نيوتن ريكس، وهو أحد المديرين التنفيذيين السابقين في مجال الذكاء الاصطناعي والذي يدير الآن مؤسسة Fairly Trained غير الربحية المعنية بالذكاء الاصطناعي، إلغاء الاشتراك بأنه “ظلم أساسي للمبدعين”، مضيفًا أن البعض قد لا يعرفون حتى متى يتم تقديم إلغاء الاشتراك. ويقول: “من الجيد بشكل خاص أن نرى هيئة حماية البيانات تدعو إلى إلغاء الاشتراك”.
يرى شاين لونجبري، رئيس مبادرة منشأ البيانات، وهي مجموعة تطوعية تدقق في مجموعات بيانات الذكاء الاصطناعي، أن جهود وكالة حماية البيانات للحصول على البيانات بطريقة أخلاقية جديرة بالإعجاب، على الرغم من أنه يشك في أن معيار الاشتراك الاختياري قد يكون صعب البيع، بسبب الحجم الهائل من البيانات التي تتطلبها معظم نماذج الذكاء الاصطناعي الحديثة. ويقول: “في ظل هذا النظام، إما أن تكون محرومًا من البيانات أو ستدفع الكثير. قد يكون الأمر أن عددًا قليلاً فقط من اللاعبين، شركات التكنولوجيا الكبرى، يمكنها تحمل تكاليف ترخيص كل هذه البيانات”.
وفي الورقة البحثية، تعارض جمعية حماية البيانات الترخيص الذي تفرضه الحكومة، وتدافع بدلاً من ذلك عن نهج “السوق الحرة” حيث يتفاوض منشئو البيانات وشركات الذكاء الاصطناعي بشكل مباشر. وهناك مبادئ توجيهية أخرى أكثر تفصيلاً. على سبيل المثال، يقترح التحالف خمسة هياكل تعويض محتملة للتأكد من حصول المبدعين وحاملي الحقوق على أجر مناسب مقابل بياناتهم. وتشمل هذه الهياكل نموذجًا قائمًا على الاشتراك، و”الترخيص القائم على الاستخدام” (حيث يتم دفع الرسوم لكل استخدام)، والترخيص “القائم على النتيجة”، حيث يتم ربط الإتاوات بالربح. ويقول بيستال: “يمكن أن ينجح هذا في أي شيء من الموسيقى إلى الصور إلى الأفلام والتلفزيون أو الكتب”.