ما هو مستقبل الزر مثل في عصر الذكاء الاصطناعي؟ يرى ماكس ليفشين – مؤسس PayPal والرئيس التنفيذي للتأكيد – دورًا جديدًا وقيماً للغاية في إعجاب البيانات بتدريب الذكاء الاصطناعى على التوصل إلى استنتاجات أكثر تمشيا مع هؤلاء صانع القرار البشري.
إنها مأزق معروف في التعلم الآلي أن الكمبيوتر الذي يتم تقديمه مع وظيفة مكافأة واضحة سيشارك في تعلم تعزيز لا هوادة فيه لتحسين أدائه وزيادة هذا المكافأة-لكن أن مسار التحسين هذا غالباً ما يؤدي إلى نتائج مختلفة للغاية مما قد ينتج عن البشر الذين يمارسون الحكم الإنساني.
لإدخال قوة تصحيحية ، يستخدم مطورو الذكاء الاصطناعى بشكل متكرر ما يسمى تعلم التعزيز من التعليقات البشرية (RLHF). في الأساس ، يضعون إبهامًا بشريًا على المقياس مع وصول الكمبيوتر إلى نموذجه من خلال تدريبه على البيانات التي تعكس التفضيلات الفعلية للأشخاص الحقيقيين. ولكن من أين تأتي بيانات التفضيل البشرية هذه ، وما مقدارها اللازم لتكون المدخلات صالحة؟ حتى الآن ، كانت هذه هي المشكلة في RLHF: إنها طريقة مكلفة إذا كانت تتطلب توظيف المشرفين البشريين والشرح لدخول التعليقات.
وهذه هي المشكلة التي يعتقد ليفشين أنه يمكن حلها بواسطة الزر مثل. إنه ينظر إلى المورد المتراكم الذي يجلس اليوم في أيدي Facebook كألهة من أي مطور يرغب في تدريب وكيل ذكي على بيانات التفضيلات البشرية. وما هو حجم الصفقة؟ أخبرنا ليفشين: “أود أن أزعم أن أحد أكثر الأشياء قيمة يمتلكه Facebook هو أن جبل البيانات الإعجاب”. في الواقع ، في نقطة الانعطاف هذه في تطوير الذكاء الاصطناعي ، والوصول إلى “ما هو المحتوى الذي يحبه البشر ، لاستخدامه في تدريب نماذج الذكاء الاصطناعى ، هو على الأرجح واحدة من أكثر الأشياء قيمة على الإنترنت.”
بينما يتصور ليفشين تعلم منظمة العفو الدولية من التفضيلات البشرية من خلال زر مثل ، فإن الذكاء الاصطناعى يغير بالفعل الطريقة التي يتم بها تشكيل هذه التفضيلات في المقام الأول. في الواقع ، تستخدم منصات التواصل الاجتماعي بنشاط الذكاء الاصطناعى ليس فقط لتحليل الإعجابات ، ولكن للتنبؤ بها – مما يجعل الزر نفسه قديمًا.
كانت هذه ملاحظة ملفقة بالنسبة لنا لأننا ، كما تحدثنا إلى معظم الناس ، جاءت التنبؤات في الغالب من زاوية أخرى ، لا تصف كيف سيؤثر الزر الذي سيؤثر على أداء الذكاء الاصطناعي ، ولكن كيف سيغير منظمة العفو الدولية عالم الزر مثل. بالفعل ، سمعنا ، يتم تطبيق منظمة العفو الدولية لتحسين خوارزميات وسائل التواصل الاجتماعي. في وقت مبكر من عام 2024 ، على سبيل المثال ، جرب Facebook استخدام AI لإعادة تصميم الخوارزمية التي توصي بكرات مقاطع فيديو للمستخدمين. هل يمكن أن يتوصل إلى توصيل أفضل للمتغيرات للتنبؤ بالفيديو الذي يرغب المستخدم في مشاهدته بعد ذلك؟ أظهرت نتيجة هذا الاختبار المبكر أنه يمكن: تطبيق الذكاء الاصطناعى على المهمة التي دفعت في أوقات مشاهدة أطول – كان مقياس الأداء فيسبوك يأمل في زيادة.
عندما سألنا مؤسس YouTube ستيف تشن ما الذي يحمله المستقبل للزر مثل ، قال: “أتساءل أحيانًا ما إذا كان الزر” ما شابه ذلك “سيكون مطلوبًا عندما يكون الذكاء الاصطناعي متطورًا بما يكفي لإخبار الخوارزمية بدقة 100 في المائة ، فإن ما تريد أن تصل إليه بعد ذلك. متاح. “
ومع ذلك ، تابع الإشارة إلى أن أحد الأسباب التي قد تكون هناك حاجة للزر مثل دائمًا هو التعامل مع التغييرات الحادة أو المؤقتة في عرض احتياجات العرض بسبب أحداث الحياة أو المواقف. وقال: “هناك أيام أرغب فيها في مشاهدة محتوى أكثر صلة بقليل ، على سبيل المثال ، أطفالي”. أوضح تشن أيضًا أن الزر الذي يعجبه قد يكون له طول العمر بسبب دوره في جذب المعلنين – المجموعة الرئيسية الأخرى إلى جانب المشاهدين والمبدعين – لأن ما شابه ذلك بمثابة أبسط مفصلات ممكنة لربط هذه المجموعات الثلاث. مع نقرة واحدة ، ينقل المشاهد في وقت واحد التقدير والتعليقات مباشرة إلى مزود المحتوى وأدلة على المشاركة والتفضيل للمعلن.