باستخدام هذا الموقع ، فإنك توافق على سياسة الخصوصية و شروط الاستخدام .
القبول

انضم الى قائمة المتابعين لتصلك جميع الاخبار مباشرة. اشترك الآن

الخليج ترند
  • الرئيسية
  • اخر الاخبار
  • دوليات
    • الولايات المتحدة
    • اوروبا
    • اسيا
    • كندا
    • افريقيا
  • اقتصاد
    • اسواق
    • شركات
    • الاستثمار
    • العملات المشفرة
  • سياسة

    سياسة

    سياسة

    الرجل المتهم بمحاولة اغتيال ترامب يطلب من القاضية إيلين كانون التنحي عن قضيته

    يطلب الرجل المتهم بالجلوس خلف سياج متصل بسلسلة على حدود ملعب الغولف التابع لدونالد ترامب في فلوريدا ومعه بندقية، بزعم…

    سياسة

    هابرمان: أصبحت لغة ترامب أكثر قتامة

    هابرمان: أصبحت لغة ترامب أكثر قتامة تقول المحللة السياسية لشبكة CNN، ماجي هابرمان، إن لغة الرئيس السابق دونالد ترامب خلال…

    سياسة

    بالنسبة لبايدن، فإن وفاة السنوار تضخ حالة من عدم اليقين – ولكنها أيضًا تفتح بابًا – لحل الصراع في غزة

    على مدار أشهر، ظل المسؤولون الأمريكيون المحبطون الذين يتطلعون إلى إنهاء الحرب في غزة يفكرون بهدوء في السيناريو الوحيد الذي…

    سياسة

    سيتم منح المواطنين اللبنانيين الذين يعيشون في الولايات المتحدة إغاثة إنسانية مع استمرار الصراع بين إسرائيل وحزب الله

    أعلنت وزارة الأمن الداخلي اليوم الخميس، أن المواطنين اللبنانيين المقيمين في الولايات المتحدة سيحصلون على شكل من أشكال الإغاثة الإنسانية،…

  • تقنية
  • رياضة
  • صحة
  • منوعات

    منوعات

    منوعات

    دراسة: الأشعة على المخ قد تتنبأ بالضعف الإدراكي لمرضى الشلل الرعاش

    في دراسة رائدة نشرت في المجلة علم الأعصاب تم اكتشاف أن موجات الدماغ قد تكون مفتاح التنبؤ بالضعف الإدراكي لدى…

    منوعات

    تايمز: بايرن ميونخ يجهز عرضًا ثالثًا لضم هاري كين

    تايمز: بايرن ميونخ يجهز عرضًا ثالثًا لضم هاري كين يخطط بايرن ميونيخ لتقديم عرض ثالث من أجل الحصول على خدمات…

    منوعات

    بالألواح الشمسية| مشروعات الظهير الزراعي بالوادي الجديد تحقق نهضة تنموية.. شاهد

    تعتبر مبادرات الظهير الزراعي التي اطلقها اللواء محمد الزملوط محافظ الوادي الجديد من المبادرات الناجحه والتي غيرت  ملامح التنمية والتطوير…

    منوعات

    سر رشاقة ممثلي هوليوود..تفاصيل دواء تخسيس شهير لقبوه بالمعجزة

    أثارت شركة Wegovy، المصنعة لأدوية إنقاص الوزن، ضجة كبيرة بعدما أصبحت الشركة الأكثر قيمة في أوروبا، متفوقة على شركة LVMH…

  • المزيد
    • ثقافة وفنون
    • سياحة وسفر
اشترك معنا
Aa
الخليج ترند
  • اخر الاخبار
  • دوليات
  • سياسة
  • اقتصاد
  • صحة
  • تقنية
  • ثقافة وفنون
  • رياضة
  • سياحة وسفر
  • منوعات
البحث
  • الرئيسية
  • اخر الاخبار
  • دوليات
    • الولايات المتحدة
    • اوروبا
    • اسيا
    • كندا
    • افريقيا
  • اقتصاد
    • اسواق
    • شركات
    • الاستثمار
    • العملات المشفرة
  • سياسة
  • تقنية
  • رياضة
  • صحة
  • منوعات
  • المزيد
    • ثقافة وفنون
    • سياحة وسفر
banner
ابق على إطلاع دائم
اخر مستجدات العالم لحظة بلحظة من جميع المصادر الموثوقة، انضم الينا الآن ليصلك كل جديد الى بريدك الإلكتروني مباشرة.
اشترك الآن

اكتشف المزيد

  • صورة اليوم
  • مقالات رأي
  • اخر الاخبار
  • رائج اليوم
  • ألنشرة البريدية
2023 © المراقب. جميع الحقوق محفوظة.
الخليج ترند > اقتصاد > شركات > تخلق Deepseek's 'Aha Moment' طريقة جديدة لبناء الذكاء الاصطناعي القوي بأموال أقل

تخلق Deepseek's 'Aha Moment' طريقة جديدة لبناء الذكاء الاصطناعي القوي بأموال أقل

فريق التحرير كتب فريق التحرير منذ 5 أشهر 8 دقيقة للقراءة
شارك

اعتمدت صينية AI Lab Deepseek تقنيات مبتكرة لتطوير نموذج منظمة العفو الدولية تم تدريبه مع تدخل بشري محدود ، مما ينتج عنه “لحظة آها” التي يمكن أن تحول تكلفة المطورين إلى بناء تطبيقات قاتلة بناءً على التكنولوجيا.

تكشف ورقة البحث التي نشرت عن أعمال “التفكير” في Deepseek عن كيفية تحقيق المجموعة ، بقيادة صندوق التحوط الملياردير Liang Wenfeng ، عن نتائج قوية عن طريق إزالة الاختناقات في تطوير الذكاء الاصطناعي.

توضح الورقة كيف اعتمدت Deepseek سلسلة من التقنيات الأكثر كفاءة لتطوير R1 ، والتي مثل نموذج O1 من Openai ، يولد إجابات دقيقة من خلال “التفكير” خطوة بخطوة حول استجاباتها لفترة أطول من معظم نماذج اللغة الكبيرة.

تأتي اختراقات Deepseek من استخدامها لـ “التعلم التعزيز” لتقليل المشاركة البشرية التي تنطوي عليها إنتاج الاستجابات للمطالبات.

قامت الشركة أيضًا ببناء نماذج أصغر مع عدد أقل من المعلمات – عدد المتغيرات المستخدمة لتدريب نظام الذكاء الاصطناعى وتشكيل ناتجها – مع إمكانيات التفكير القوية من خلال تعديل النماذج الكبيرة التي تدربها منافسون مثل Meta و Alibaba.

وقد أرسلت هذه التطورات معًا موجات صدمة في جميع أنحاء وادي السيليكون ، حيث تتفوق R1 على بعض المهام مقارنةً بالنماذج التي تم إصدارها مؤخرًا من Openai و Anthropic و Meta ، ولكن في جزء صغير من الأموال التي يجب تطويرها.

في يوم الثلاثاء ، قالت Openai إنها وجدت أدلة على أن Deepseek قد أدى إلى تعبئة تقنيتها ، وذلك باستخدام مخرجات من نماذجها لتدريب LLMs بتكلفة أقل ، وهي ممارسة شائعة مع الأكاديميين والشركات الناشئة الأقل تمويلًا جيدًا.

على الرغم من الجدل ، قال الخبراء إن ديبسيك أظهر ابتكارًا حقيقيًا. أشاد باحثو الذكاء الاصطناعى أيضًا باستعداده لنشر تقرير فني مفصل يوضح كيفية بنائه نموذج التفكير ، وهي المرة الأولى التي يقوم فيها المختبر بذلك.

وقال نيل لورانس ، أستاذ التعلم الآلي DeepMind في جامعة كامبريدج: “أعتقد أنها مجرد غيض من الجبل الجليدي من حيث نوع الابتكار الذي يمكن أن نتوقعه في هذه النماذج”. “يوضح التاريخ أن الشركات الكبرى تكافح من أجل الابتكار مع توسيع نطاقها ، وما رأيناه من العديد من هذه الشركات الكبيرة هو استبدال لحساب الاستثمار للعمل الشاق الفكري.”

تؤدي الإبهام إلى “لحظة آها”

تم تصميم نماذج اللغة الكبيرة على مرحلتين. الأول يسمى “التدريب المسبق” ، حيث يستخدم المطورون مجموعات بيانات ضخمة تساعد النماذج على التنبؤ بالكلمة التالية في الجملة. تسمى المرحلة الثانية “بعد التدريب” ، حيث يقوم المطورون بتدريس النموذج لاتباع التعليمات ، مثل حل مشاكل الرياضيات أو الترميز.

تسمى إحدى طرق الحصول على chatbots لتوليد المزيد من الاستجابات المفيدة “التعلم التعزيز من التعليقات البشرية” (RLHF) ، وهي تقنية رائدة من قبل Openai لتحسين ChatGPT.

يعمل RLHF من قبل المذيعين البشريين الذين يطلقون على استجابات نموذج الذكاء الاصطناعى للمطالبات واختيار الاستجابات الأفضل. غالبًا ما تكون هذه الخطوة شاقة ومكلفة وتستغرق وقتًا طويلاً ، وغالبًا ما تتطلب جيشًا صغيرًا من شركات البيانات البشرية.

يتمثل الابتكار الكبير لـ Deepseek في أتمتة هذه الخطوة الأخيرة ، باستخدام تقنية تسمى التعلم التعزيز (RL) ، حيث يتم مكافأة نموذج الذكاء الاصطناعي لفعل الشيء الصحيح.

طور Deepseek أولاً نموذجًا قويًا لإعداد النصوص يسمى V3. ثم استخدم RL “لمكافأة” النموذج ، مثل إعطائه إبهامًا لإنشاء الإجابة الصحيحة.

وجدت الشركة الصينية أنه من خلال القيام بهذه العملية مرات كافية ، تمكن النموذج من حل المشكلات تلقائيًا دون إشراف بشري.

تم استخدام هذه التقنية أيضًا من قبل Google DeepMind لبناء AlphaGo ، نظام الذكاء الاصطناعى الذي فاز على اللاعبين البشريين في لعبة اللوحة القديمة Go وبدأت الطفرة الحالية في تقنيات الحوسبة التعليمية العميقة قبل عقد من الزمان تقريبًا.

قالت Deepseek إنها اكتشفت أن النموذج كان لديه ما وصفته الشركة بـ “لحظة آها” عندما أعيد تقييم إجاباته وتعديل وقت المعالجة لحل الأسئلة المختلفة.

“إن” لحظة آها “بمثابة تذكير قوي بإمكانات (RL) لإطلاق مستويات جديدة من الذكاء في الأنظمة الاصطناعية ، مما يمهد الطريق لنماذج أكثر استقلالية وتكيفية في المستقبل” ، كتب المبدعون في ديبسيك في ورقة البحث الخاصة بهم.

وقال لويس تونستال ، الباحث في شركة Hugging Face ، وهي شركة أبحاث منظمة العفو الدولية: “يبدو أن الصلصة السرية لجعل هذا العمل هي مجرد نموذج قوي للغاية تم تدريبه مسبقًا ، ثم الحصول على جيد جدًا جدًا ، جيد جدًا جدًا ، جيد جدًا جدًا. البنية التحتية للقيام بعملية التعلم التعزيز هذه على نطاق واسع. “

نماذج صغيرة مصممة باستخدام تلك الكبيرة

بينما تستثمر Openai و Google مليارات الدولارات لبناء نماذج لغوية كبيرة ، قام Deepseek أيضًا ببناء نماذج أصغر يمكن تشغيلها على الهواتف أو متصفحات الويب من خلال “تقطير” إمكانات التفكير في النماذج الأكبر.

استخدم Deepseek نموذج R1 الخاص به لإنشاء مجموعة صغيرة نسبيًا من 800000 نقطة بيانات ، ثم قامت بتعديل النماذج التي صنعها منافسون مثل Qwen's Qwen و Meta's باستخدام البيانات التي تم إنشاؤها من الذكاء الاصطناعى.

وجدت Deepseek أن هذه النماذج المقطرة كانت قوية بشكل خاص في معايير التفكير ، في بعض الحالات تفوق نماذج الرائدة مثل كلود الأنثروبور. وقال تونستال: “يمكن أن يحل معظم مشاكل الرياضيات التي واجهتها في المرحلة الجامعية الأولى”.

يمكن أن يكون هذا التطور بمثابة نعمة لمطوري التطبيقات ، الذين لديهم طريقة رخيصة وفعالة لبناء المنتجات. تعليم نماذج الذكاء الاصطناعى العقل أثناء “الاستدلال”-عندما يولد النموذج إجابات-يكون أكثر كفاءة من عملية التدريب المسبق ، والتي تتطلب الكثير من قوة الحوسبة ، وفقًا لما ذكره Lennart Heim ، وهو باحث في Rand ، وهو عبارة .

وأضاف أن هذا النموذج الجديد يمكن أن يسمح للمنافسين ببناء نماذج تنافسية بقوة الحوسبة والمال. ومع ذلك ، بدون أموال للرقائق ، “لا يمكنهم نشرها على نفس الحجم” ، قال هايم.

لم يقل Deepseek المبلغ الذي أنفقه لبناء R1 ، لكنه ادعى أنه قام بتدريب نموذج V3 الخاص به ، والذي يعتمد R1 ، مقابل 5.6 مليون دولار فقط.

هذا المبلغ لا يشمل التكاليف الأخرى ، مثل الاستحواذ المحتمل لآلاف وحدات معالجة الرسومات لتدريب النموذج ، أو الرواتب ، والتجارب ، والتدريب والنشر.

وعلى الرغم من أن Deepseek كان أول من استخدم تقنياتها الخاصة ، من المتوقع أن تحذو حذو مختبرات الذكاء الاصطناعي الأخرى ، مع وجود وجه معانقة يعمل بالفعل على تكرار R1.

عملت شركات AI الأمريكية أيضًا على استخدام قدراتها على النماذج الكبيرة المنتشرة في نماذج أصغر وأكثر ذكاءً. أطلقت Google Gemma العام الماضي ، وهو نموذج أكثر خفيفة الوزن يعتمد على Gemini.

يقول توماس وولف ، المؤسس المشارك وكبير مسؤولي العلوم في Hugging Face ، مضيفًا أن تقنيات Deepseek كانت مفهومة جيدًا من قبل الآخرين في هذا المجال: “وصفة الذكاء بسيطة للغاية” ، مضيفًا أن تقنيات Deepseek كانت مفهومة جيدًا من قبل الآخرين في هذا المجال. “وهذا هو السبب في أنني أتوقع أن تتمكن الكثير من الفرق من إعادة هذا الأمر.”

شارك في تقارير إضافية من كريستينا كريدل في سان فرانسيسكو ومادووميتا مورجيا في لندن

فريق التحرير يناير 29, 2025 يناير 29, 2025
شارك المقال
فيسبوك تويتر واتساب واتساب نسخ الرابط طباعة
شارك
المقال السابق تعرف على موعد صرف مستحقات لاعبي الزمالك
المقال التالي للعام الثاني علي التوالي.. بسمة بالحجاب في مسلسلها الرمضاني “ظلم المصاطب”
اترك تعليقك اترك تعليقك

اترك تعليقاً إلغاء الرد

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

تابع معنا اخر الاخبار لحظة بلحظة واطلع على ما يحدث في العالم من حولك

ابق على إطلاع

اخر مستجدات العالم لحظة بلحظة من جميع المصادر الموثوقة، انضم الينا الآن ليصلك كل جديد.

اشترك الآن

رائج اليوم

ما حكم من يصدق كلام العرافين؟.. عالم أزهري يحذر

أكد الشيخ أشرف عبد الجواد، أحد علماء الأزهر الشريف، أن سيدنا محمد صلى الله عليه…

منوعات منذ 3 أيام

استفتاء ضريبة الميراث spooks swiss super-rich

فتح Digest محرر مجانًاتختار رولا خالاف ، محررة FT ، قصصها المفضلة في هذه النشرة…

شركات منذ 3 أيام

أحداث لوس أنجلوس تلقي بظلالها| توتر جديد بين البيت الأبيض وولاية كاليفورنيا.. تفاصيل كاملة

في مشهد قضائي يحمل أبعادا دستورية وسياسية عميقة، أثار قرار محكمة استئناف أمريكية الجدل من…

منوعات منذ يومين

اقتصادية النواب تطالب بتعميم تجربة “القاهرة” لمكافحة المخدات بجميع المحافظات

طالب الدكتور محمد عبد الحميد وكيل لجنة الشئون الاقتصادية بمجلس النواب من الدكتور أسامة الأزهرى…

منوعات منذ يومين

كيف أصبحت تاكوما ، واشنطن القاتل التسلسلي الكابيتول لأمريكا

في عام 1996 ، اعترف جاك Spillman (A K A the Werewolf Butcher) بقتل ثلاثة…

منوعات منذ يومين

اكتشف المزيد

  • صورة اليوم
  • مقالات رأي
  • اخر الاخبار
  • رائج اليوم
  • النشرة البريدية

مقالات ذات صلة

وول ستريت إذا استجيبوا الإشارة من سباق عمد مامداني

شركات

أبل مغلق في مفاوضات متجر التطبيقات في اللحظة الأخيرة لتجنب غرامات بروكسل

شركات

عاد ملك SPACS

شركات

حكومة المملكة المتحدة لاستثمار أكثر من 500 مليون جنيه إسترليني في الحوسبة الكمومية

شركات

يطلق الناشطون تحديًا قانونيًا لخطة Reservoir Thames Water

شركات

توافق Advent

شركات

صعود رأس المال الاستثماري “قبل المخطط”

شركات

شبكة هاتف فلوريدا وراء طموحات ترامب موبايل “مصنوعة في أمريكا”

شركات
مصدرك الأول لآخر الاخبار العالمية
Facebook Twitter Youtube Instagram Linkedin

2023 © المراقب. جميع الحقوق محفوظة.

روابط هامة

  • الرئيسية
  • من نحن
  • سياسة الخصوصية
  • اعلن معنا
  • اتصل بنا

أهم الأقسام

  • ثقافة وفنون
  • سياحة وسفر
  • سياسة
  • صحة
  • اقتصاد

نرشح لك

الأنبا توماس يلتقي الأخوات الراهبات بالإيبارشية
بدأ دونالد ترامب وشون هانيتي موجة من التضليل بعد تفجير إيران
الطاقة الذرية تطالب بالكشف على اليورانيوم بالمنشآت الإيرانية

صحيفة المراقب هي صحيفة يومية عربية تهتم بآخر اخبار المملكة العربية السعودية والخليج العربي والشرق الأوسط والعالم. تابع معنا اخر اخبار الاقتصاد والرياضة والسياسة واهم القضايا التي تهم المواطن العربي.

Welcome Back!

Sign in to your account

نسيت كلمة المرور؟