أذهل مختبر صيني صغير للذكاء الاصطناعي العالم هذا الأسبوع بالكشف عن الوصفة التقنية لنموذجه المتطور، وتحويل زعيمه المنعزل إلى بطل قومي تحدى المحاولات الأمريكية لوقف طموحات الصين في مجال التكنولوجيا الفائقة.
أصدرت شركة DeepSeek، التي أسسها مدير صندوق التحوط Liang Wenfeng، نموذج R1 يوم الاثنين، موضحة في ورقة مفصلة كيفية بناء نموذج لغوي كبير بميزانية محدودة يمكن أن يتعلم ويحسن نفسه تلقائيًا دون إشراف بشري.
وكانت الشركات الأمريكية بما في ذلك OpenAI وGoogle DeepMind رائدة في تطوير نماذج الاستدلال، وهو مجال جديد نسبياً من أبحاث الذكاء الاصطناعي الذي يحاول جعل النماذج تتوافق مع القدرات المعرفية البشرية. وفي ديسمبر/كانون الأول، أصدرت شركة OpenAI، ومقرها سان فرانسيسكو، النسخة الكاملة من نموذجها o1، لكنها أبقت أساليبها سرية.
أثار إصدار DeepSeek R1 جدلاً محمومًا في وادي السيليكون حول ما إذا كانت شركات الذكاء الاصطناعي الأمريكية ذات الموارد الأفضل، بما في ذلك Meta وAnthropic، يمكنها الدفاع عن تفوقها التقني.
وفي الوقت نفسه، أصبحت ليانغ نقطة محورية للفخر الوطني في الداخل. وفي هذا الأسبوع، كان هو القائد الوحيد في مجال الذكاء الاصطناعي الذي تم اختياره لحضور اجتماع معلن لرجال الأعمال مع ثاني أقوى زعيم في البلاد، لي تشيانغ. وقد طُلب من رواد الأعمال “تركيز الجهود لاختراق التقنيات الأساسية الرئيسية”.
في عام 2021، بدأ Liang في شراء الآلاف من وحدات معالجة الرسومات Nvidia لمشروعه الجانبي للذكاء الاصطناعي أثناء إدارة صندوق التداول الكمي الخاص به High-Flyer. نظر المطلعون على الصناعة إلى الأمر على أنه تصرفات غريبة الأطوار لملياردير يبحث عن هواية جديدة.
“عندما التقينا به لأول مرة، كان رجلًا مهووسًا للغاية وله تسريحة شعر فظيعة ويتحدث عن بناء مجموعة مكونة من 10000 شريحة لتدريب نماذجه الخاصة. قال أحد شركاء ليانغ التجاريين: “لم نأخذه على محمل الجد”.
“لم يتمكن من التعبير عن رؤيته سوى القول: أريد بناء هذا، وسيكون بمثابة تغيير في قواعد اللعبة. وأضاف الشخص: “كنا نظن أن هذا ممكن فقط من عمالقة مثل ByteDance وAlibaba”.
كانت مكانة ليانغ كغريب في مجال الذكاء الاصطناعي مصدرًا غير متوقع للقوة. وفي شركة High-Flyer، تمكن من بناء ثروة باستخدام الذكاء الاصطناعي والخوارزميات لتحديد الأنماط التي يمكن أن تؤثر على أسعار الأسهم. أصبح فريقه ماهرًا في استخدام رقائق Nvidia لكسب المال من تداول الأسهم. وفي عام 2023، أطلق برنامج DeepSeek، معلنا عن نيته تطوير الذكاء الاصطناعي على المستوى البشري.
قال أحد المؤسسين في شركة LLM منافسة: “لقد قام ليانج ببناء فريق بنية تحتية استثنائي يفهم حقًا كيفية عمل الرقائق”. “لقد أخذ معه أفضل موظفيه من صندوق التحوط إلى DeepSeek.”
بعد أن منعت واشنطن شركة Nvidia من تصدير أقوى رقائقها إلى الصين، اضطرت شركات الذكاء الاصطناعي المحلية إلى إيجاد طرق مبتكرة لتعظيم قوة الحوسبة لعدد محدود من الرقائق المحلية – وهي مشكلة عرف فريق ليانغ بالفعل كيفية حلها.
قال أحد باحثي الذكاء الاصطناعي المقرب من الشركة: “يعرف مهندسو DeepSeek كيفية إطلاق العنان لإمكانات وحدات معالجة الرسوميات هذه، حتى لو لم تكن على أحدث طراز”.
يقول المطلعون على الصناعة إن تركيز DeepSeek الوحيد على الأبحاث يجعلها منافسًا خطيرًا لأنها مستعدة لمشاركة اكتشافاتها بدلاً من حمايتها لتحقيق مكاسب تجارية. لم تقم DeepSeek بجمع الأموال من الصناديق الخارجية أو اتخاذ خطوات مهمة لتحقيق الدخل من نماذجها.
قال أحد مستثمري الذكاء الاصطناعي في بكين: “يتم تشغيل DeepSeek مثل الأيام الأولى لـ DeepMind”. “إنها تركز بشكل كامل على البحث والهندسة.”
يستخدم Liang، الذي يشارك شخصيًا في أبحاث DeepSeek، عائدات تداول صناديق التحوط الخاصة به لدفع رواتب أعلى لأفضل المواهب في مجال الذكاء الاصطناعي. جنبا إلى جنب مع ByteDance المالكة لـ TikTok، تشتهر DeepSeek بتقديم أعلى أجر متاح لمهندسي الذكاء الاصطناعي في الصين، مع وجود موظفين في مكاتب في هانغتشو وبكين.
قال الشريك التجاري: “تبدو مكاتب DeepSeek وكأنها حرم جامعي للباحثين الجادين”. “يؤمن الفريق برؤية ليانغ: أن يُظهر للعالم أن الصينيين قادرون على الإبداع وبناء شيء من الصفر.”
ولم يستجب DeepSeek وHigh-Flyer لطلب التعليق.
صنف ليانج شركة DeepSeek على أنها شركة “محلية” فريدة من نوعها، يعمل بها حاملو شهادات الدكتوراه من أفضل المدارس الصينية، وجامعات بكين، وتسينجهوا، وبيهانج، وليس خبراء من المؤسسات الأمريكية.
وفي مقابلة مع الصحافة المحلية العام الماضي، قال إن فريقه الأساسي “لم يكن لديه أشخاص عادوا من الخارج. كلهم محليين . . . علينا تطوير أفضل المواهب بأنفسنا”. لقد نالت هوية DeepSeek باعتبارها شركة صينية بحتة في مجال LLM استحسانًا في الداخل.
زعمت شركة DeepSeek أنها استخدمت فقط 2048 جهاز Nvidia H800 و5.6 مليون دولار لتدريب نموذج يحتوي على 671 مليار معلمة، وهو جزء صغير مما أنفقته OpenAI وGoogle لتدريب نماذج ذات أحجام مماثلة.
وقال ريتويك غوبتا، الباحث في سياسات الذكاء الاصطناعي في جامعة كاليفورنيا، بيركلي، إن الإصدارات الأخيرة من نماذج DeepSeek تثبت أنه “لا يوجد خندق عندما يتعلق الأمر بقدرات الذكاء الاصطناعي”.
وقال: “يجب على الشخص الأول الذي يقوم بتدريب العارضات أن ينفق الكثير من الموارد للوصول إلى هناك”. “لكن المحرك الثاني يمكنه الوصول إلى هناك بسعر أرخص وبسرعة أكبر.”
وأضاف جوبتا أن الصين لديها مجموعة من المواهب من مهندسي الأنظمة أكبر بكثير من الولايات المتحدة الذين يفهمون كيفية الحصول على أفضل استخدام لموارد الحوسبة لتدريب وتشغيل النماذج بتكلفة أقل.
ويقول المطلعون على الصناعة إنه على الرغم من أن DeepSeek قد أظهر نتائج مثيرة للإعجاب بموارد محدودة، إلا أنه يظل سؤالًا مفتوحًا حول ما إذا كان بإمكانه الاستمرار في المنافسة مع تطور الصناعة.
تأخرت عوائد High-Flyer، الداعم الكبير لها، في عام 2024، وهو ما ألقى أحد الأشخاص المقربين من Liang باللوم فيه على تركيز اهتمام المؤسس في الغالب على DeepSeek.
ولم يقف منافسوها في الولايات المتحدة ساكنين. إنهم يقومون ببناء “مجموعات” ضخمة من رقائق بلاكويل من الجيل التالي من إنفيديا، مما يخلق قوة حاسوبية تهدد مرة أخرى بخلق فجوة في الأداء مع المنافسين الصينيين.
هذا الأسبوع، قالت شركة OpenAI إنها بصدد إنشاء مشروع مشترك مع SoftBank الياباني، يطلق عليه اسم Stargate، مع خطط لإنفاق ما لا يقل عن 100 مليار دولار على البنية التحتية للذكاء الاصطناعي في الولايات المتحدة. تعمل شركة Elon Musk's xAI على توسيع حاسوبها العملاق Colossus بشكل كبير ليحتوي على أكثر من مليون وحدة معالجة رسومات للمساعدة في تدريب نماذج Grok AI الخاصة بها.
وقال شريك ليانغ التجاري: “تمتلك DeepSeek واحدة من أكبر مجموعات الحوسبة المتقدمة في الصين”. “لديهم القدرة الكافية في الوقت الحالي، ولكن ليس لفترة أطول بكثير.”
تقارير إضافية من وينجي دينغ في بكين