في العام الماضي، أصبح Stack Overflow واحدًا من أوائل مواقع الويب التي أعلنت أنها ستفرض رسومًا على عمالقة الذكاء الاصطناعي مقابل الوصول إلى المحتوى المستخدم لتدريب برامج الدردشة الآلية. الآن، قامت خدمة الأسئلة والأجوبة الشهيرة للمبرمجين بتسجيل أول عميل لها – Google – وهو ما يقول الرئيس التنفيذي براشانث شاندراسيكار إنه بداية لتدفق جديد “هادف” من الإيرادات.
تعتبر هذه الصفقة مهمة، لأنه لا يزال من غير الواضح إلى أي مدى ستدفع جوجل وغيرها من مطوري الذكاء الاصطناعي مقابل المحتوى المطلوب لمشاريع الذكاء الاصطناعي. لقد ساهمت ملايين الكتب والمواقع الإلكترونية في تطوير أنظمة الذكاء الاصطناعي، لكن لم يتم تعويض معظم الناشرين، ويقاضي البعض ما يزعمون أنه سوء استخدام. يبدو أن العديد من الناشرين، بما في ذلك Stack Overflow، مهددون من قبل ChatGPT ومنتجات الذكاء الاصطناعي الأخرى، والتي يمكنها الإجابة على الاستفسارات التي كانت ترسل المبرمجين في السابق.
ستشهد الصفقة استخدام قسم السحابة في Google للأسئلة والأجوبة من Stack Overflow حول خدمات Google Cloud لتقديم المساعدة في البرمجة والدعم الفني من خلال إصدار من برنامج Gemini chatbot من Google. سيتمكن عملاء الحوسبة السحابية من Google أيضًا من طرح الأسئلة من خلال واجهة سطر أوامر Google Cloud. يقول شاندراسيكار: “قد لا يمتلك الذكاء الاصطناعي الخاص بهم جميع الإجابات، ولذلك لدينا قدرة هائلة على المساعدة في إكمال هذه الحلقة”. “نحن أكبر مكان يتم فيه تنظيم المعرفة المجتمعية والتحقق من صحتها.”
سوف تقوم Gemini بتلخيص الإجابات المستمدة من Stack Overflow بكلماتها الخاصة ولكنها تتضمن شعار الشركة ورابطًا للعودة إلى المادة الأصلية واسم المستخدم للمساهم في الموقع الذي قدمها. وتخطط الشركات لعرض النظام في Google Cloud Next، وهو المؤتمر السحابي السنوي لشركة البحث في أبريل، وإطلاقه بعد فترة وجيزة.
يقول Chandrasekar أنه لا توجد قيود كبيرة على كيفية استخدام Google Cloud لبيانات Stack Overflow، مما يعني أنه يمكن استخدامها لتدريب نماذج اللغات الكبيرة وأنظمة الذكاء الاصطناعي الأخرى. ويقول: “إن ما نريد أن نقف عليه بثبات هو – الأشياء غير القابلة للتفاوض بالنسبة لنا – الثقة والدقة والجودة والإسناد إلى مصادر مخرجات الذكاء الاصطناعي هذه”.
ورفض تحديد المبلغ الذي تدفعه Google مقابل Stack Overflow مقابل البيانات. يقول شاندراسيكار: “سيكون هذا عرضًا تجاريًا ذا معنى بالنسبة لنا على المدى القريب والمتوسط والطويل”.
التقشير الخفي
قامت Google ومطورو الذكاء الاصطناعي الآخرون بجمع البيانات من Stack Overflow ومواقع الويب الأخرى دون سابق إنذار. مع تزايد الطلب على تقنيات الذكاء الاصطناعي التوليدية – وارتفاع تقييمات الشركات التي تعمل على تطويرها – بدأت مواقع الويب التي توفر النص التأسيسي تطالب بما تعتبره حصتها العادلة. يقول تشاندراسيكار، إنه لحسن الحظ بالنسبة لشركة Stack Overflow، فقد استجاب العملاء المحتملون للرسالة. ويقول: “لسنا مضطرين إلى مطاردة الناس”.
تعد بيانات Stack Overflow مفيدة بشكل خاص لأنظمة الذكاء الاصطناعي التي تولد أكواد الكمبيوتر، والتي أثبتت شعبيتها لدى مهندسي البرمجيات ومصدرًا مهمًا للإيرادات لشركة Microsoft وOpenAI.
تأتي صفقة Stack Overflow الجديدة بعد أسبوع واحد فقط من توصل Google إلى اتفاقية ترخيص لنقل البيانات من Reddit، مشغل منتديات المناقشة، الذي ساعد محتواه في قدرة روبوتات الدردشة على التحدث. كشفت Reddit عن خطط لبدء فرض رسوم على الوصول إلى البيانات قبل ظهور Stack Overflow في العام الماضي.