الأسبوع الماضي ، بعثت جمعية المؤلفين برسالة مفتوحة إلى قادة بعض أكبر شركات الذكاء الاصطناعي التوليدية في العالم. وقع عليها أكثر من 9000 كاتب ، من بينهم مؤلفون بارزون مثل جورج سوندرز ومارجريت أتوود ، طلبت من أمثال Alphabet و OpenAI و Meta و Microsoft “الحصول على الموافقة والائتمان وتعويض الكتاب بشكل عادل عن استخدام المواد المحمية بحقوق الطبع والنشر في تدريب الذكاء الاصطناعي.” هذا النداء هو فقط الأحدث في سلسلة من الجهود التي يبذلها المبدعون لتأمين الائتمان والتعويض عن الدور الذي يزعمون أن عملهم لعبه في تدريب أنظمة الذكاء الاصطناعي التوليدية.
تم الاحتفاظ ببيانات التدريب المستخدمة لنماذج اللغة الكبيرة ، أو LLMs ، وأنظمة الذكاء الاصطناعي التوليدية الأخرى ، سرية. ولكن كلما زاد استخدام هذه الأنظمة ، زاد عدد الكتاب والفنانين المرئيين الذين لاحظوا أوجه التشابه بين عملهم ومخرجات هذه الأنظمة. دعا الكثيرون شركات الذكاء الاصطناعي التوليدية إلى الكشف عن مصادر بياناتها ، و- كما هو الحال مع Authors Guild – لتعويض أولئك الذين تم استخدام أعمالهم. بعض المناشدات عبارة عن رسائل مفتوحة ومنشورات على وسائل التواصل الاجتماعي ، لكن العدد المتزايد هو دعاوى قضائية.
هنا يلعب قانون حقوق النشر دورًا رئيسيًا. ومع ذلك ، فهي أداة غير مجهزة للتعامل مع النطاق الكامل لمخاوف الفنانين ، سواء كانت مخاوف طويلة الأمد بشأن التوظيف والتعويض في عالم انقلبت عليه الإنترنت ، أو مخاوف جديدة بشأن الخصوصية والخصائص الشخصية – وغير القابلة لحقوق النشر. بالنسبة للعديد من هؤلاء ، يمكن أن تقدم حقوق النشر إجابات محدودة فقط. يقول مايك ماسنيك ، محرر مدونة التكنولوجيا Techdirt: “هناك الكثير من الأسئلة التي يطرحها الذكاء الاصطناعي لكل جانب من جوانب المجتمع تقريبًا”. “لكن هذا التركيز الضيق على حق المؤلف كأداة للتعامل معه ، كما أعتقد ، هو في غير محله حقًا.”
الأكثر شهرة من هذه الدعاوى القضائية الأخيرة ، تم رفعها في وقت سابق من هذا الشهر عندما رفعت الممثلة الكوميدية سارة سيلفرمان ، جنبًا إلى جنب مع أربعة مؤلفين آخرين في ملفين منفصلين ، دعوى قضائية ضد شركة OpenAI ، زاعمة أن الشركة دربت نظام ChatGPT الشهير على أعمالهم دون إذن. تم رفع كلتا الدعويين من قبل مكتب جوزيف سافيري للمحاماة ، المتخصص في دعاوى مكافحة الاحتكار. تمثل الشركة أيضًا الفنانين الذين يقاضون Stability AI و Midjourney و DeviantArt لأسباب مماثلة. في الأسبوع الماضي ، خلال جلسة استماع في هذه القضية ، أشار قاضي المحكمة الجزئية الأمريكية ويليام أوريك إلى أنه قد يرفض معظم الدعوى ، مشيرًا إلى أنه نظرًا لأن هذه الأنظمة قد تم تدريبها على “خمسة مليارات صورة مضغوطة” ، فإن الفنانين المعنيين بحاجة إلى “تقديم المزيد من الحقائق” بشأن دعاواهم المتعلقة بانتهاك حقوق الطبع والنشر.
تدعي قضية سيلفرمان ، من بين أمور أخرى ، أن شركة أوبن إيه آي ربما ألغت مذكرات الممثل الكوميدي ، الرذاذ، عبر “مكتبات الظل” التي تستضيف مجموعات من الكتب الإلكترونية والأوراق الأكاديمية المقرصنة. يقول ماثيو ساج ، أستاذ القانون في جامعة إيموري ، إنه إذا وجدت المحكمة في صالح سيلفرمان وزملائها المدعين ، فقد يشكل الحكم سابقة جديدة لكيفية نظر القانون إلى مجموعات البيانات المستخدمة في تدريب نماذج الذكاء الاصطناعي. على وجه التحديد ، يمكن أن يساعد في تحديد ما إذا كان يمكن للشركات المطالبة بالاستخدام العادل عندما تقوم نماذجها بكشط المواد المحمية بحقوق الطبع والنشر. يقول ساج عن دعوى سيلفرمان القضائية: “لن أتحدث عن نتيجة هذا السؤال”. “لكن يبدو أنها الأكثر إلحاحًا من بين جميع القضايا التي تم رفعها”. لم تستجب شركة أوبن إيه آي لطلبات التعليق.
يشرح ساغ أن جوهر هذه الحالات هو نفس النظرية العامة: أن LLMs “نسخت” أعمال المؤلفين المحمية. ومع ذلك ، كما أوضح ساج في شهادته أمام لجنة فرعية تابعة لمجلس الشيوخ الأمريكي في وقت سابق من هذا الشهر ، فإن نماذج مثل GPT-3.5 و GPT-4 لا “تنسخ” بالمعنى التقليدي. استوعب سيكون فعلًا أكثر ملاءمة – هضم بيانات التدريب لأداء وظيفتها: التنبؤ بأفضل كلمة تالية في تسلسل. قال ساج في شهادته في مجلس الشيوخ: “بدلاً من التفكير في ماجستير في القانون على أنه نسخ لبيانات التدريب مثل الكاتب في دير ، فمن المنطقي التفكير في الأمر على أنه تعلم من بيانات التدريب مثل الطالب”.