اليوم، تعد DeepSeek واحدة من شركات الذكاء الاصطناعي الرائدة الوحيدة في الصين التي لا تعتمد على التمويل من عمالقة التكنولوجيا مثل Baidu أو Alibaba أو ByteDance.
مجموعة شابة من العباقرة حريصون على إثبات أنفسهم
وفقًا لليانغ، عندما قام بتشكيل فريق بحث DeepSeek، لم يكن يبحث عن مهندسين ذوي خبرة لبناء منتج موجه للمستهلك. وبدلاً من ذلك، ركز على طلاب الدكتوراه من أفضل الجامعات في الصين، بما في ذلك جامعة بكين وجامعة تسينغهوا، الذين كانوا حريصين على إثبات أنفسهم. تم نشر العديد منها في مجلات مرموقة وفازت بجوائز في مؤتمرات أكاديمية دولية، لكنها كانت تفتقر إلى الخبرة الصناعية، وفقًا للنشرة التكنولوجية الصينية QBitAI.
قال ليانغ لـ 36Kr في عام 2023: “إن المناصب الفنية الأساسية لدينا يتم شغلها في الغالب من قبل الأشخاص الذين تخرجوا هذا العام أو في العام أو العامين الماضيين”. ساعدت استراتيجية التوظيف في إنشاء ثقافة شركة تعاونية حيث كان للناس الحرية في استخدام موارد حاسوبية وافرة لمتابعة مشاريع بحثية غير تقليدية إنها طريقة مختلفة تمامًا للعمل من شركات الإنترنت القائمة في الصين، حيث تتنافس الفرق غالبًا على الموارد. (مثال حديث: اتهمت شركة ByteDance متدربًا سابقًا – حائز على جائزة أكاديمية مرموقة، على الأقل – بتخريب عمل زملائه من أجل تخزين المزيد من موارد الحوسبة لفريقه).
وقال ليانغ إن الطلاب يمكن أن يكونوا أكثر ملاءمة للأبحاث ذات الاستثمار المرتفع والربح المنخفض. وأوضح أن “معظم الناس، عندما يكونون صغارًا، يمكنهم تكريس أنفسهم بالكامل لمهمة ما دون اعتبارات نفعية”. وكان عرضه أمام الموظفين المحتملين هو أن DeepSeek تم إنشاؤه “لحل أصعب الأسئلة في العالم”.
يقول الخبراء إن حقيقة أن هؤلاء الباحثين الشباب تلقوا تعليمهم بالكامل تقريبًا في الصين تزيد من دافعهم. يوضح تشانغ: “يجسد هذا الجيل الأصغر أيضًا حسًا بالوطنية، خاصة وهم يتنقلون عبر القيود الأمريكية ونقاط الاختناق في تقنيات الأجهزة والبرمجيات المهمة”. “إن تصميمهم على التغلب على هذه الحواجز لا يعكس طموحهم الشخصي فحسب، بل يعكس أيضًا التزامًا أوسع بتعزيز مكانة الصين باعتبارها رائدة عالمية في مجال الابتكار.”
الابتكار ولد من رحم الأزمة
في أكتوبر/تشرين الأول 2022، بدأت حكومة الولايات المتحدة في وضع ضوابط التصدير التي منعت بشدة شركات الذكاء الاصطناعي الصينية من الوصول إلى الرقائق المتطورة مثل Nvidia's H100. قدمت هذه الخطوة مشكلة لـ DeepSeek. بدأت الشركة بمخزون يبلغ 10000 جهاز H100، لكنها كانت بحاجة إلى المزيد للتنافس مع شركات مثل OpenAI وMeta. وقال ليانغ لـ36Kr في مقابلة ثانية في عام 2024: “المشكلة التي نواجهها لم تكن التمويل على الإطلاق، بل الرقابة على الصادرات من الرقائق المتقدمة”.
كان على DeepSeek أن تتوصل إلى طرق أكثر فعالية لتدريب نماذجها. تقول ويندي تشانغ، مهندسة البرمجيات التي تحولت إلى سياسة: “لقد قاموا بتحسين بنية نموذجهم باستخدام مجموعة من الحيل الهندسية – مخططات الاتصال المخصصة بين الرقائق، وتقليل حجم الحقول لحفظ الذاكرة، والاستخدام المبتكر لنهج مزيج النماذج”. محلل في معهد مركاتور للدراسات الصينية. “العديد من هذه الأساليب ليست أفكارًا جديدة، ولكن الجمع بينها بنجاح لإنتاج نموذج متطور يعد إنجازًا رائعًا.”
كما حقق DeepSeek تقدمًا كبيرًا في مجال الانتباه الكامن متعدد الرؤوس (MLA) ومزيج الخبراء، وهما تصميمان تقنيان يجعلان نماذج DeepSeek أكثر فعالية من حيث التكلفة من خلال طلب موارد حاسوبية أقل للتدريب. في الواقع، يعد أحدث نموذج من DeepSeek فعالاً للغاية لدرجة أنه يتطلب تدريبه عُشر القوة الحاسوبية لنموذج Llama 3.1 المماثل من Meta، وفقًا لمؤسسة الأبحاث Epoch AI.
إن رغبة DeepSeek في مشاركة هذه الابتكارات مع الجمهور قد أكسبتها قدرًا كبيرًا من حسن النية داخل مجتمع أبحاث الذكاء الاصطناعي العالمي. بالنسبة للعديد من شركات الذكاء الاصطناعي الصينية، فإن تطوير نماذج مفتوحة المصدر هو الطريقة الوحيدة للحاق بنظيراتها الغربية، لأنها تجتذب المزيد من المستخدمين والمساهمين، مما يساعد بدوره على نمو النماذج. يقول تشانغ: “لقد أثبتوا الآن أنه يمكن بناء النماذج المتطورة باستخدام أموال أقل، وإن كانت كثيرة، وأن المعايير الحالية لبناء النماذج تترك مجالًا كبيرًا للتحسين”. “نحن على يقين من أننا سنرى المزيد من المحاولات في هذا الاتجاه في المستقبل.”
وقد تؤدي هذه الأخبار إلى حدوث مشكلات بالنسبة لضوابط التصدير الحالية في الولايات المتحدة والتي تركز على خلق اختناقات في موارد الحوسبة. يقول تشانغ: “إن التقديرات الحالية لمدى قوة الحوسبة في مجال الذكاء الاصطناعي في الصين، وما يمكن أن تحققه من خلال هذه القوة، يمكن أن تنقلب رأساً على عقب”.