فتح Digest محرر مجانًا
تختار رولا خالاف ، محررة FT ، قصصها المفضلة في هذه النشرة الإخبارية الأسبوعية.
قام رئيس الذكاء الاصطناعي من Microsoft Mustafa Suleyman بسرقة زملائه السابقين في Google Deepmind الذين قاموا ببناء ميزة توليد البودكاست الشهيرة ، حيث سباق الشركات المتنافسة لبناء تطبيقات مربحة من التكنولوجيا المتطورة.
قام سليمان ، وهو رجل أعمال بريطاني شارك في تأسيس DeepMind في عام 2010 ، بتوظيف ماركو تاجلياسشي و Zalán Borsos ، وهما كبار العلماء وراء “نظرة عامة على الصوت” والتي تعد جزءًا من Google AI Research Notebooklm. تتيح الميزة للمستخدمين تحويل النص إلى صوت يحتوي على نمط بودكاست محادثة جذاب.
عمل الزوج أيضًا على Astra و DeepMind's Ai Agent القادم ، والذي يمكنه الإجابة على الأسئلة في الوقت الفعلي عبر الفيديو والصوت والنص.
سيركز استئجار ثالث من DeepMind ، Matthias Minderer ، على تطوير قدرات الرؤية ، أو قدرة نماذج AI على تحليل الصور. سينضم الباحثون إلى مختبر الذكاء الاصطناعي الجديد من Microsoft في زيوريخ.
أعلن الرجال الثلاثة تحركاتهم يوم الثلاثاء. قال شخص مطلع على التعيينات إن الباحثين كانوا جزءًا لا يتجزأ من دفع سليمان لبناء الجيل القادم من Copilot ، حيث تسعى Microsoft إلى إنشاء وكلاء AI تفاعلي يمكنهم إكمال المهام من حجز الرحلات الجوية إلى إدارة التقاويم.
“إنه فريق ممتاز وسيكون مركزًا مهمًا لـ (Microsoft AI) إلى جانب مكتبنا في لندن ، والذي ينمو بسرعة أيضًا!” كتب سليمان على LinkedIn.
“لا تزال الذكاء الاصطناعي قوة تحويلية ، حيث تلعب الصوت دورًا مهمًا في تشكيل تفاعلات طبيعية وبديهية وغامرة” ، كتب Tagliasacchi على LinkedIn.
تأتي هذه الخطوة وسط معركة شرسة للموهبة بين المجموعات التكنولوجية المتنافسة للحصول على أفضل موهبة منظمة العفو الدولية.
غادر سليمان Deepmind في عام 2022 للعمل كمستثمر مغامرة ، ثم أنشأ بعد ذلك انعطاف منظمة العفو الدولية.
انضم إلى Microsoft في مارس 2024 كجزء من صفقة جلبت العديد من أعضاء موظفي Endection إلى عملاق التكنولوجيا الأمريكية. استأجرت Suleyman أعضاء وحدة AI الصحية من Google DeepMind ، بالإضافة إلى باحثين بارزين من شركة AI من شركة مثل Nando de Freitas. لقد فقدت Google أيضًا أفضل مواهب الذكاء الاصطناعي للمنافسة Apple.
تعد Microsoft و Google من بين الشركات التي تركز على إنشاء وكلاء من خلال نماذج الذكاء الاصطناعي “متعدد الوسائط” ، والتي يمكنها تحليل المحتوى في الصوت أو مقاطع الفيديو أو الصور.
في العام الماضي ، أطلقت Openai وضعًا صوتيًا متقدمًا لـ ChatGPT ، والذي سمح للمستخدمين على سبيل المثال بالتفاعل مع الذكاء الاصطناعى بطريقة أكثر طبيعية. من المقرر أن يتم إطلاق Astra Astra من AI-ACTA من Google من Google في عام 2025 ، بينما تسعى Amazon إلى تقديم نماذج منظمة العفو الدولية للمساعد الرقمي الذي يعمل بصوت الصوت Alexa.
ورفض Google DeepMind التعليق.