لقد تخلل تاريخ الذكاء الاصطناعي فترات تسمى “شتاء الذكاء الاصطناعي”، عندما بدا أن التكنولوجيا وصلت إلى طريق مسدود وجف التمويل. وقد كان كل واحد منها مصحوبًا بتصريحات مفادها أن جعل الآلات ذكية حقًا هو أمر يصعب على البشر اكتشافه.
إن إصدار Google لنموذج Gemini، الذي يُزعم أنه نوع جديد تمامًا من نماذج الذكاء الاصطناعي وأقوى نموذج للشركة حتى الآن، يشير إلى أن شتاء الذكاء الاصطناعي الجديد لن يأتي في أي وقت قريب. في الواقع، على الرغم من أن الأشهر الـ 12 التي تلت إطلاق ChatGPT كانت عامًا رائعًا بالنسبة للذكاء الاصطناعي، إلا أن هناك سببًا وجيهًا للاعتقاد بأن طفرة الذكاء الاصطناعي الحالية بدأت للتو.
لم تكن لدى OpenAI توقعات عالية عندما أطلقت “معاينة البحث الرئيسية المنخفضة” المسماة ChatGPT في نوفمبر 2022. لقد كانت مجرد اختبار لواجهة جديدة لنماذج اللغات الكبيرة المولدة للنصوص (LLMs). لكن قدرة روبوت الدردشة على القيام بمجموعة واسعة من الأشياء، بدءًا من تجميع المقالات والشعر إلى الإجابة على مشكلات البرمجة، أثارت إعجاب الكثير من الناس وأثارت أعصابهم وأشعلت النار في صناعة التكنولوجيا. عندما أضافت OpenAI برنامج GPT-4 LLM الجديد إلى ChatGPT، شعر بعض الخبراء بالذعر لدرجة أنهم توسلوا إلى الشركة لإبطاء وتيرة عملها.
كانت الأدلة قليلة بالفعل على أن أي شخص استجاب لنداء الإنذار هذا. من غير المتصور الآن أن جوجل قد رفعت حجم الرهان – وربما غيرت أيضًا قواعد اللعبة – من خلال الإعلان عن برج الجوزاء.
كانت جوجل قد سارعت بالفعل إلى تقديم استجابة مباشرة لـ ChatGPT في شكل Bard في وقت سابق من هذا العام، وأطلقت أخيرًا تقنية LLM chatbot التي طورتها في وقت سابق لـ OpenAI ولكنها اختارت الحفاظ على خصوصيتها. مع Gemini، تدعي أنها فتحت حقبة جديدة تتجاوز LLMs المرتكزة بشكل أساسي على النص، مما يمهد الطريق لجولة جديدة من منتجات الذكاء الاصطناعي تختلف بشكل كبير عن تلك التي يتيحها ChatGPT.
تطلق Google على Gemini نموذجًا “متعدد الوسائط محليًا”، مما يعني أنه يمكنه التعلم من البيانات بما يتجاوز النص فقط، كما يمكنه أيضًا الحصول على رؤى من الصوت والفيديو والصور. يُظهر ChatGPT كيف يمكن لنماذج الذكاء الاصطناعي أن تتعلم قدرًا رائعًا عن العالم إذا تم توفير نص كافٍ. وقد جادل بعض الباحثين في مجال الذكاء الاصطناعي بأن مجرد جعل النماذج اللغوية أكبر من شأنه أن يزيد من قدراتها إلى درجة منافسة قدرات البشر.
ولكن لا يوجد سوى الكثير الذي يمكنك تعلمه عن الواقع المادي من خلال مرشح النص الذي كتبه البشر عنه، والقيود التي يصعب القضاء عليها في LLMs مثل GPT-4 – مثل المعلومات المهلوسة، والتفكير الضعيف، وأمانها الغريب. يبدو أن العيوب – تشير إلى أن توسيع نطاق التكنولوجيا الحالية له حدوده.
قبل إعلان Gemini بالأمس، تحدثت WIRED مع Demis Hassabis، المدير التنفيذي الذي قاد تطوير Gemini والذي تشمل إنجازاته السابقة قيادة الفريق الذي طور الروبوت الخارق AlphaGo. لقد كان مبالغًا فيه كما هو متوقع بشأن برنامج Gemini، مدعيًا أنه يقدم إمكانات جديدة من شأنها أن تجعل منتجات Google بارزة في النهاية. لكن هاسابيس قال أيضًا إنه لتقديم أنظمة ذكاء اصطناعي يمكنها فهم العالم بطرق لا تستطيع روبوتات الدردشة اليوم القيام بها، سيتعين دمج ماجستير إدارة الأعمال مع تقنيات الذكاء الاصطناعي الأخرى.
يخوض هاسابيس منافسة شرسة مع شركة OpenAI، لكن يبدو أن المنافسين متفقون على أن هناك حاجة إلى أساليب جديدة جذرية. يشير مشروع غامض قيد التنفيذ في OpenAI، يسمى Q*، إلى أن الشركة تستكشف أيضًا أفكارًا تتضمن القيام بما هو أكثر من مجرد توسيع نطاق أنظمة مثل GPT-4.
يتناسب هذا مع التصريحات التي أدلى بها سام ألتمان، الرئيس التنفيذي لشركة OpenAI، في معهد ماساتشوستس للتكنولوجيا في أبريل، عندما أوضح أنه على الرغم من نجاح ChatGPT، فإن مجال الذكاء الاصطناعي يحتاج إلى فكرة جديدة كبيرة لتحقيق مزيد من التقدم الكبير. وقال ألتمان: “أعتقد أننا في نهاية العصر الذي ستكون فيه هذه النماذج العملاقة العملاقة”. “سوف نجعلهم أفضل بطرق أخرى.”
ربما تكون Google قد أظهرت للتو نهجًا يمكنه تجاوز ChatGPT. ولكن ربما تكون الرسالة الأكثر بروزًا من إطلاق Gemini هي أن Google عازمة على التوجه نحو شيء أكثر أهمية من روبوتات الدردشة اليوم – تمامًا كما يبدو أن OpenAI أيضًا.