في ستينيات القرن الماضي ، ابتكر عالم في معهد ماساتشوستس للتكنولوجيا برنامج معالجة للغة الطبيعية يمكنه محاكاة المحادثة البشرية. تم تسميتها باسم ELIZA ، وكانت تكرارًا مبكرًا لبرامج الدردشة الآلية المنتشرة في جميع أنحاء قطاع التكنولوجيا هذا العام. لم تكن إليزا مسعىً مربحًا. ولا الإصدارات الحالية.
هناك احتمالات تحويلية واضحة في الذكاء الاصطناعي التوليدي. تم تطوير روبوتات المحادثة باستخدام نماذج لغة كبيرة (LLMs) يمكن أن تسمح باتصالات سلسة بين البشر وأجهزة الكمبيوتر.
السؤال بالنسبة للمستثمرين هو ما إذا كان بإمكان LLMs المملوكة للملكية جني الأموال بشكل موثوق للتكنولوجيا الكبيرة. يمكن أن تكون LLM مفتوحة المصدر بديلاً أرخص للشركات التي تطور تطبيقات مخصصة.
LLM ليس لها تعريف رسمي. توصف بأنها برامج مدربة على كميات هائلة من البيانات المتاحة على الإنترنت وقادرة على التنبؤ بالكلمة التالية في الجملة.
نظرًا لزيادة قوة الحوسبة ، تمكنت أنظمة الذكاء الاصطناعي من تنفيذ التعلم غير الخاضع للإشراف من البيانات غير المنظمة. يقدمون بعض الإجابات التي تفاجئ حتى مبتكريهم.
لقد قفز تعقيد LLM إلى الأمام. في عام 2020 ، أصدرت شركة OpenAI محولها التوليدي مسبق الصنع 3 ، أو GPT-3. هذا LLM كان يحتوي على 175 مليار معلمة.
كلما زاد عدد المعلمات ، زادت البيانات التي يمكن لـ LLM معالجتها وتوليدها. تمتلك PaLM من Google ، التي تشغل روبوت الدردشة Bard ، 540 مليارًا. أحدث إصدار من OpenAI من LLM هو GPT-4. لم تحدد الشركة عدد المعلمات. يعتقد النقاد أن 100 تريليون سيكون رقمًا دقيقًا.
قوة المعالجة المطلوبة لمثل LLMs هائلة. القاعدة العامة هي أنه كلما زادت مجموعة البيانات المستخدمة ، كان الأداء أفضل. هذا ، من الناحية النظرية ، يقصر LLM على عدد صغير من الشركات جيدة التمويل.
لكن التطبيقات المتخصصة يمكن أن تعمل باستخدام مجموعات بيانات أصغر. يحتوي BloombergGPT ، الذي يهدف إلى المساعدة في تحليل المعلومات على محطات بيانات بلومبيرج ، على معلمات تبلغ 50 مليار. نموذج LLM الأساسي لشركة Cohere AI ومقرها تورونتو ، لديه 52 مليار معلمة.
مصدر قلق أكبر لشركات مثل Google هي LLMs مفتوحة المصدر. تخلت Meta عن نظامها LLaMA كبرنامج مفتوح المصدر يمكن نسخه واستخدامه من قبل أي شخص. يمكن بناء LLM أصغر فوقه.
لنفترض أن مستخدمي المؤسسات قرروا أن هناك فرقًا بسيطًا بين LLMs الخاصة والمفتوحة المصدر عند تطوير خدمات الذكاء الاصطناعي الخاصة بهم ، فإن Google و OpenAI سيفقدون ميزتهم الأولى قبل أن تتاح لهم فرصة التعادل.