تقول جوجل أن هناك ثلاثة إصدارات من الجوزاء: Ultra، الأكبر والأكثر قدرة؛ النانو، وهو أصغر بكثير وأكثر كفاءة؛ وPro، متوسطة الحجم وإمكانيات متوسطة.
اعتبارًا من اليوم، سيتم تشغيل برنامج Bard من Google، وهو برنامج دردشة مشابه لـ ChatGPT، بواسطة Gemini Pro، وهو تغيير تقول الشركة إنه سيجعله قادرًا على التفكير والتخطيط بشكل أكثر تقدمًا. واليوم، يتم دمج نسخة متخصصة من Gemini Pro في نسخة جديدة من AlphaCode، وهي أداة توليدية للبرمجة من Google DeepMind، وهي عبارة عن “منتج بحثي”. سيتم وضع أقوى إصدار من Gemini، Ultra، داخل Bard وإتاحته من خلال واجهة برمجة التطبيقات السحابية في عام 2024.
يقول سيسي هسياو، نائب رئيس شركة Google والمدير العام لشركة Bard، إن إمكانات النموذج المتعدد الوسائط منحت Bard مهارات جديدة وجعلته أفضل في مهام مثل تلخيص المحتوى والعصف الذهني والكتابة والتخطيط. يقول هسياو: “هذه هي أكبر التحسينات الفردية لجودة Bard منذ إطلاقنا لها”.
رؤية جديدة
عرضت Google العديد من العروض التوضيحية التي توضح قدرة الجوزاء على التعامل مع المشكلات التي تتضمن معلومات مرئية. وشاهد أحدهم نموذج الذكاء الاصطناعي يستجيب لمقطع فيديو قام فيه شخص ما برسم صور، وإنشاء ألغاز بسيطة، وطلب أفكار ألعاب تتضمن خريطة للعالم. كما أظهر اثنان من الباحثين في Google كيف يمكن لـ Gemini المساعدة في البحث العلمي من خلال الإجابة على أسئلة حول ورقة بحثية تحتوي على رسوم بيانية ومعادلات.
يقول كولينز إن نموذج Gemini Pro الذي سيتم طرحه هذا الأسبوع، تفوق على النموذج السابق الذي كان يدعم ChatGPT في البداية، والذي يسمى GPT-3.5، في ستة من أصل ثمانية معايير شائعة الاستخدام لاختبار ذكاء برامج الذكاء الاصطناعي.
تقول Google إن النموذج Gemini Ultra، الذي سيظهر لأول مرة العام المقبل، يسجل 90 بالمائة، وهو أعلى من أي نموذج آخر بما في ذلك GPT-4، في معيار فهم اللغة متعدد المهام الضخم (MMLU)، الذي طوره باحثون أكاديميون لاختبار نماذج اللغة في أسئلة حول موضوعات بما في ذلك الرياضيات وتاريخ الولايات المتحدة والقانون.
وقال كولينز: “إن جيميني هو أحدث ما توصلت إليه التكنولوجيا عبر مجموعة واسعة من المعايير – 30 من أصل 32 من المعايير المستخدمة على نطاق واسع في مجتمع أبحاث التعلم الآلي”. “وهكذا نرى أنها ترسم الحدود في جميع المجالات.”