يشهد عالم الذكاء الاصطناعي مؤخرًا تحولًا كبيرًا في فهم كيفية تطوير النماذج الذكية، حيث لم تعد اختبارات مثل “اختبار تورينج” الشهيرة كافية لقياس التقدم الحقيقي.
فبينما تدّعي بعض النماذج تجاوز هذا الاختبار، يزداد الجدل حول ما إذا كانت هذه النماذج مصممة فقط لتحقيق نتائج جيدة في الاختبارات، وليس لتحقيق ذكاء حقيقي ومستدام.
تدريب الذكاء الاصطناعي محدودة وثابتة
لكن وفقًا لعلماء في وحدة DeepMind التابعة لشركة Google، فإن المشكلة لا تكمن في الاختبارات نفسها، بل في طريقة تطوير النماذج ذاتها، حيث يشيرون إلى أن البيانات المستخدمة لتدريب الذكاء الاصطناعي “محدودة وثابتة”، ولن تقود هذه النماذج إلى قدرات جديدة ومتقدمة.
وفي ورقة بحثية حديثة نشرتها DeepMind، ضمن كتاب مرتقب عن دار نشر MIT Press، يقترح العالمان الشهيران “ديفيد سيلفر” و”ريتشارد ساتون” أن الذكاء الاصطناعي يجب أن يُمنح نوعًا من “الخبرات التفاعلية”، ليتمكن من التفاعل مع العالم ووضع أهداف خاصة به بناءً على إشارات من البيئة المحيطة.
التعلم التعزيزي
وكتب الباحثان في ورقتهما المعنونة “مرحبًا بكم في عصر التجربة و القدرات المذهلة ستظهر بمجرد استغلال الإمكانات الكاملة للتعلم التجريبي”.
الجدير بالذكر أن سيلفر هو العقل المدبر وراء AlphaZero، نموذج الذكاء الاصطناعي الذي تفوق على البشر في ألعاب الشطرنج وGo، بينما يعتبر ساتون أحد مطوري منهجية “التعلم التعزيزي” (Reinforcement Learning) الحاصلة على جائزة تورينج، والتي كانت أساسًا في تطوير AlphaZero.
ويقوم النهج الجديد الذي يدعوان إليه، والذي أطلقا عليه اسم “Streams”، على تطوير الذكاء الاصطناعي بما يتجاوز قدرات نماذج اللغة الحالية (LLMs) مثل ChatGPT، والتي تقتصر في جوهرها على الرد على أسئلة المستخدمين.
الذكاء الاصطناعي التوليدي
ويشير الباحثان إلى أن الانتقال من AlphaGo وAlphaZero إلى نماذج الذكاء الاصطناعي التوليدي (Gen AI) مثل ChatGPT، كان بمثابة تخلٍ عن التعلم التعزيزي، وهو ما وفر قدرات واسعة في التفاعل مع المستخدمين، لكنه تسبب في فقدان “قدرة النموذج على اكتشاف المعرفة ذاتيًا”.
حُكم المستخدم
فبينما تعتمد النماذج التوليدية الحالية على “حُكم المستخدم” في صياغة الأسئلة أو التعليمات، فإن هذا النهج، حسب وصف الباحثين، “يفرض سقفًا لا يمكن للنموذج تجاوزه، لأنه لا يستطيع استكشاف استراتيجيات جديدة لم يقدّرها المستخدم أصلاً”.
يعد هذا الطرح دعوة لإعادة التفكير في مستقبل الذكاء الاصطناعي، والتركيز على نماذج قادرة على التعلُّم الذاتي من خلال التجربة، وليس فقط من خلال التدريب التقليدي على بيانات قديمة.