الرئيس التنفيذي لشركة Google ساندر بيتشاي يتحدث في محادثة مع إميلي تشانغ خلال قمة الرؤساء التنفيذيين لمنظمة التعاون الاقتصادي لآسيا والمحيط الهادئ (APEC) في موسكون ويست في 16 نوفمبر 2023 في سان فرانسيسكو، كاليفورنيا. وتعقد قمة أبيك في سان فرانسيسكو وتستمر حتى 17 تشرين الثاني/نوفمبر.
جاستن سوليفان | جيتي إيمجز نيوز | صور جيتي
جوجل تطلق ما تعتبره نموذج الذكاء الاصطناعي الأكبر والأكثر قدرة يوم الأربعاء مع تزايد الضغط على الشركة للإجابة على كيفية تحقيق الدخل من الذكاء الاصطناعي.
سيتضمن نموذج اللغة الكبير Gemini مجموعة من ثلاثة أحجام مختلفة: Gemini Ultra، الفئة الأكبر والأكثر قدرة؛ Gemini Pro، الذي يتوسع عبر مجموعة واسعة من المهام؛ وGemini Nano، والذي سيتم استخدامه لمهام وأجهزة محمولة محددة.
في الوقت الحالي، تخطط الشركة لترخيص Gemini للعملاء من خلال Google Cloud ليتمكنوا من استخدامها في تطبيقاتهم الخاصة. بدءًا من 13 ديسمبر، يمكن للمطورين وعملاء المؤسسات الوصول إلى Gemini Pro عبر Gemini API في Google AI Studio أو Google Cloud Vertex AI. سيتمكن مطورو Android أيضًا من البناء باستخدام Gemini Nano. سيتم استخدام Gemini أيضًا لتشغيل منتجات Google مثل برنامج Bard chatbot وSearch Geneative Experience، الذي يحاول الإجابة على استفسارات البحث بنص على شكل محادثة (SGE غير متاح على نطاق واسع حتى الآن).
Gemini Ultra هو النموذج الأول الذي يتفوق على الخبراء البشريين في MMLU (فهم اللغة متعدد المهام الهائل)، والذي يستخدم مجموعة من 57 موضوعًا مثل الرياضيات والفيزياء والتاريخ والقانون والطب والأخلاق لاختبار كل من المعرفة العالمية وقدرات حل المشكلات. وقالت الشركة في تدوينة يوم الأربعاء. من المفترض أن يفهم الفروق الدقيقة والمنطق في المواضيع المعقدة.
ساندر بيتشاي، الرئيس التنفيذي لشركة Alphabet Inc.، خلال مؤتمر Google I/O للمطورين في ماونتن فيو، كاليفورنيا، الولايات المتحدة، يوم الأربعاء 10 مايو 2023.
ديفيد بول موريس | بلومبرج | صور جيتي
وكتب الرئيس التنفيذي ساندر بيتشاي في تدوينة يوم الأربعاء: “إن Gemini هو نتيجة لجهود تعاونية واسعة النطاق بذلتها فرق عبر Google، بما في ذلك زملائنا في Google Research”. “لقد تم تصميمه من الألف إلى الياء ليكون متعدد الوسائط، مما يعني أنه يمكنه التعميم والفهم بسلاسة والعمل عبر ودمج أنواع مختلفة من المعلومات بما في ذلك النص والتعليمات البرمجية والصوت والصورة والفيديو.”
بدءًا من اليوم، سيستخدم برنامج chatbot Bard من Google برنامج Gemini Pro للمساعدة في التفكير المتقدم والتخطيط والفهم والإمكانات الأخرى. وفي أوائل العام المقبل، ستطلق “Bard Advanced”، والتي ستستخدم Gemini Ultra، حسبما قال مسؤولون تنفيذيون في اتصال مع الصحفيين يوم الثلاثاء. إنه يمثل أكبر تحديث لبرنامج Bard، وهو برنامج الدردشة الآلي الشبيه بـ ChatGPT.
يأتي التحديث بعد ثمانية أشهر من إطلاق عملاق البحث Bard لأول مرة وبعد عام واحد من إطلاق OpenAI لـ ChatGPT على GPT-3.5. في شهر مارس من هذا العام، أطلقت الشركة الناشئة التي يقودها سام ألتمان GPT-4. قال المسؤولون التنفيذيون يوم الثلاثاء إن Gemini Pro تفوق على GPT-3.5 لكنهم تجنبوا الأسئلة حول كيفية مواجهته مع GPT-4.
عندما سئل عما إذا كانت Google لديها خطط لفرض رسوم مقابل الوصول إلى “Bard Advanced”، قال المدير العام لشركة Google لـ Bard، سيسي هسياو، إنها تركز على إنشاء تجربة جيدة وليس لديها أي تفاصيل لتحقيق الدخل حتى الآن.
عندما سُئل في مؤتمر صحفي عما إذا كان لدى Gemini أي قدرات جديدة مقارنة بالجيل الحالي من حاملي شهادات LLM، أجاب Eli Collins، نائب رئيس المنتج في Google DeepMind، “أظن أنه يمتلك ذلك” ولكنه لا يزال يعمل على فهم قدرات Gemini Ultra الجديدة.
يقال إن جوجل أجلت إطلاق Gemini لأنها لم تكن جاهزة، مما يعيد ذكريات الإطلاق الصعب للشركة لأدوات الذكاء الاصطناعي الخاصة بها في بداية العام.
سأل العديد من المراسلين عن التأخير، فأجاب كولينز بأن اختبار النماذج الأكثر تقدمًا يستغرق وقتًا أطول. وقال كولينز إن Gemini هو نموذج الذكاء الاصطناعي الأكثر اختبارًا الذي بنته الشركة وأنه يتمتع “بتقييمات السلامة الأكثر شمولاً” لأي نموذج من نماذج Google.
وقال كولينز إنه على الرغم من كونه أكبر طراز له، إلا أن خدمة Gemini Ultra أرخص بكثير في الخدمة. وقال “إنها ليست أكثر قدرة فحسب، بل إنها أكثر كفاءة”. “ما زلنا بحاجة إلى حوسبة كبيرة لتدريب جيميني ولكننا أصبحنا أكثر كفاءة من حيث قدرتنا على تدريب هذه النماذج.”
وقال كولينز إن الشركة ستصدر ورقة بيضاء فنية تحتوي على مزيد من التفاصيل حول النموذج يوم الأربعاء لكنها قالت إنها لن تنشر عدد المحيط. في وقت سابق من هذا العام، وجدت CNBC أن نموذج اللغة الكبير PaLM 2 من Google، وهو أحدث نموذج للذكاء الاصطناعي في ذلك الوقت، استخدم ما يقرب من خمسة أضعاف كمية البيانات النصية للتدريب مثل سابقتها LLM.
وفي يوم الأربعاء أيضًا، قدمت جوجل وحدة معالجة الموتر من الجيل التالي لتدريب نماذج الذكاء الاصطناعي. شريحة TPU v5p، والتي قوة المبيعات وقالت Google إن شركة Lightricks وشركة Lightricks الناشئة التي بدأت في استخدامها، تقدم أداءً أفضل بالنسبة للسعر مقارنة بـ TPU v4 الذي تم الإعلان عنه في عام 2021. لكن الشركة لم تقدم معلومات عن الأداء مقارنة بالشركة الرائدة في السوق نفيديا.
ويأتي إعلان الرقائق بعد أسابيع من المنافسين السحابيين أمازون و مايكروسوفت عرضت السيليكون المخصص الذي يستهدف الذكاء الاصطناعي.
خلال المؤتمر الهاتفي لأرباح الربع الثالث من Google في شهر أكتوبر، طرح المستثمرون على المديرين التنفيذيين المزيد من الأسئلة حول كيفية تحويل الذكاء الاصطناعي إلى ربح فعلي.
في أغسطس، أطلقت جوجل “تجربة مبكرة” تسمى تجربة البحث التوليدية، أو SGE، والتي تتيح للمستخدمين معرفة كيف ستبدو تجربة الذكاء الاصطناعي التوليدية عند استخدام محرك البحث – لا يزال البحث مركز ربح رئيسي للشركة. والنتيجة هي المزيد من المحادثة، مما يعكس عصر برامج الدردشة الآلية. ومع ذلك، فإنه لا يزال يعتبر تجربة ولم يتم إطلاقه بعد لعامة الناس.
ويطالب المستثمرون بجدول زمني لشركة SGE منذ شهر مايو، عندما أعلنت الشركة لأول مرة عن التجربة في مؤتمر المطورين السنوي Google I/O. لم يشر إعلان Gemini يوم الأربعاء إلى SGE، وكان المسؤولون التنفيذيون غامضين بشأن خطط إطلاقها لعامة الناس، قائلين إنه سيتم دمج Gemini فيها “في العام المقبل”.
وقال بيتشاي في تدوينة يوم الأربعاء: “يمثل هذا العصر الجديد من النماذج أحد أكبر الجهود العلمية والهندسية التي قمنا بها كشركة”. “أنا متحمس حقًا لما ينتظرنا، وللفرص التي سيفتحها الجوزاء للناس في كل مكان.”
– ساهم Jordan Novet من CNBC في هذا التقرير.
لا تفوّت هذه القصص من CNBC PRO: