باستخدام هذا الموقع ، فإنك توافق على سياسة الخصوصية و شروط الاستخدام .
القبول

انضم الى قائمة المتابعين لتصلك جميع الاخبار مباشرة. اشترك الآن

الخليج ترند
  • الرئيسية
  • اخر الاخبار
  • دوليات
    • الولايات المتحدة
    • اوروبا
    • اسيا
    • كندا
    • افريقيا
  • اقتصاد
    • اسواق
    • شركات
    • الاستثمار
    • العملات المشفرة
  • سياسة

    سياسة

    سياسة

    الرجل المتهم بمحاولة اغتيال ترامب يطلب من القاضية إيلين كانون التنحي عن قضيته

    يطلب الرجل المتهم بالجلوس خلف سياج متصل بسلسلة على حدود ملعب الغولف التابع لدونالد ترامب في فلوريدا ومعه بندقية، بزعم…

    سياسة

    هابرمان: أصبحت لغة ترامب أكثر قتامة

    هابرمان: أصبحت لغة ترامب أكثر قتامة تقول المحللة السياسية لشبكة CNN، ماجي هابرمان، إن لغة الرئيس السابق دونالد ترامب خلال…

    سياسة

    بالنسبة لبايدن، فإن وفاة السنوار تضخ حالة من عدم اليقين – ولكنها أيضًا تفتح بابًا – لحل الصراع في غزة

    على مدار أشهر، ظل المسؤولون الأمريكيون المحبطون الذين يتطلعون إلى إنهاء الحرب في غزة يفكرون بهدوء في السيناريو الوحيد الذي…

    سياسة

    سيتم منح المواطنين اللبنانيين الذين يعيشون في الولايات المتحدة إغاثة إنسانية مع استمرار الصراع بين إسرائيل وحزب الله

    أعلنت وزارة الأمن الداخلي اليوم الخميس، أن المواطنين اللبنانيين المقيمين في الولايات المتحدة سيحصلون على شكل من أشكال الإغاثة الإنسانية،…

  • تقنية
  • رياضة
  • صحة
  • منوعات

    منوعات

    منوعات

    السيطرة على حريق ثلاجة للخضر والفاكهة بالقليوبية وبدء أعمال التبريد| صور

    تابع المهندس أيمن عطية محافظ القليوبية يرافقه اللواء عبد الفتاح القصاص مساعد وزير الداخلية مدير أمن القليوبية أعمال السيطرة علي…

    منوعات

    رسوم ترامب الجمركية “أمر غبي” والكنديون أمام طريق صعب

    قال رئيس الوزراء الكندي، جاستن ترودو، اليوم الثلاثاء، إن الرسوم الجمركية الشاملة التي فرضها الرئيس الأمريكي دونالد ترامب "أمر غبي…

    منوعات

    قرار خفض أسعار الفائدة خطوة هامة لتحريك عجلة الاقتصاد الوطني

    أشاد هاني عبد السميع، أمين مساعد حزب مستقبل وطن بمحافظة البحر الأحمر، بقرار لجنة السياسة النقدية بالبنك المركزي المصري بخفض…

    منوعات

    مصير مؤلم للكيان الشرير..بيان عاجل من المرشد الإيراني بعد الهجوم الإسرائيلي

    نقلت وكالة "مهر" الإيرانية، اليوم الجمعة، عن المرشد الإيراني علي خامنئي، قوله إن الهجوم الإسرائيلي الأخير على إيران يكشف "الطبيعة…

  • المزيد
    • ثقافة وفنون
    • سياحة وسفر
اشترك معنا
Aa
الخليج ترند
  • اخر الاخبار
  • دوليات
  • سياسة
  • اقتصاد
  • صحة
  • تقنية
  • ثقافة وفنون
  • رياضة
  • سياحة وسفر
  • منوعات
البحث
  • الرئيسية
  • اخر الاخبار
  • دوليات
    • الولايات المتحدة
    • اوروبا
    • اسيا
    • كندا
    • افريقيا
  • اقتصاد
    • اسواق
    • شركات
    • الاستثمار
    • العملات المشفرة
  • سياسة
  • تقنية
  • رياضة
  • صحة
  • منوعات
  • المزيد
    • ثقافة وفنون
    • سياحة وسفر
banner
ابق على إطلاع دائم
اخر مستجدات العالم لحظة بلحظة من جميع المصادر الموثوقة، انضم الينا الآن ليصلك كل جديد الى بريدك الإلكتروني مباشرة.
اشترك الآن

اكتشف المزيد

  • صورة اليوم
  • مقالات رأي
  • اخر الاخبار
  • رائج اليوم
  • ألنشرة البريدية
2023 © المراقب. جميع الحقوق محفوظة.
الخليج ترند > اقتصاد > شركات > تخلق Deepseek's 'Aha Moment' طريقة جديدة لبناء الذكاء الاصطناعي القوي بأموال أقل

تخلق Deepseek's 'Aha Moment' طريقة جديدة لبناء الذكاء الاصطناعي القوي بأموال أقل

فريق التحرير كتب فريق التحرير منذ 5 أشهر 8 دقيقة للقراءة
شارك

اعتمدت صينية AI Lab Deepseek تقنيات مبتكرة لتطوير نموذج منظمة العفو الدولية تم تدريبه مع تدخل بشري محدود ، مما ينتج عنه “لحظة آها” التي يمكن أن تحول تكلفة المطورين إلى بناء تطبيقات قاتلة بناءً على التكنولوجيا.

تكشف ورقة البحث التي نشرت عن أعمال “التفكير” في Deepseek عن كيفية تحقيق المجموعة ، بقيادة صندوق التحوط الملياردير Liang Wenfeng ، عن نتائج قوية عن طريق إزالة الاختناقات في تطوير الذكاء الاصطناعي.

توضح الورقة كيف اعتمدت Deepseek سلسلة من التقنيات الأكثر كفاءة لتطوير R1 ، والتي مثل نموذج O1 من Openai ، يولد إجابات دقيقة من خلال “التفكير” خطوة بخطوة حول استجاباتها لفترة أطول من معظم نماذج اللغة الكبيرة.

تأتي اختراقات Deepseek من استخدامها لـ “التعلم التعزيز” لتقليل المشاركة البشرية التي تنطوي عليها إنتاج الاستجابات للمطالبات.

قامت الشركة أيضًا ببناء نماذج أصغر مع عدد أقل من المعلمات – عدد المتغيرات المستخدمة لتدريب نظام الذكاء الاصطناعى وتشكيل ناتجها – مع إمكانيات التفكير القوية من خلال تعديل النماذج الكبيرة التي تدربها منافسون مثل Meta و Alibaba.

وقد أرسلت هذه التطورات معًا موجات صدمة في جميع أنحاء وادي السيليكون ، حيث تتفوق R1 على بعض المهام مقارنةً بالنماذج التي تم إصدارها مؤخرًا من Openai و Anthropic و Meta ، ولكن في جزء صغير من الأموال التي يجب تطويرها.

في يوم الثلاثاء ، قالت Openai إنها وجدت أدلة على أن Deepseek قد أدى إلى تعبئة تقنيتها ، وذلك باستخدام مخرجات من نماذجها لتدريب LLMs بتكلفة أقل ، وهي ممارسة شائعة مع الأكاديميين والشركات الناشئة الأقل تمويلًا جيدًا.

على الرغم من الجدل ، قال الخبراء إن ديبسيك أظهر ابتكارًا حقيقيًا. أشاد باحثو الذكاء الاصطناعى أيضًا باستعداده لنشر تقرير فني مفصل يوضح كيفية بنائه نموذج التفكير ، وهي المرة الأولى التي يقوم فيها المختبر بذلك.

وقال نيل لورانس ، أستاذ التعلم الآلي DeepMind في جامعة كامبريدج: “أعتقد أنها مجرد غيض من الجبل الجليدي من حيث نوع الابتكار الذي يمكن أن نتوقعه في هذه النماذج”. “يوضح التاريخ أن الشركات الكبرى تكافح من أجل الابتكار مع توسيع نطاقها ، وما رأيناه من العديد من هذه الشركات الكبيرة هو استبدال لحساب الاستثمار للعمل الشاق الفكري.”

تؤدي الإبهام إلى “لحظة آها”

تم تصميم نماذج اللغة الكبيرة على مرحلتين. الأول يسمى “التدريب المسبق” ، حيث يستخدم المطورون مجموعات بيانات ضخمة تساعد النماذج على التنبؤ بالكلمة التالية في الجملة. تسمى المرحلة الثانية “بعد التدريب” ، حيث يقوم المطورون بتدريس النموذج لاتباع التعليمات ، مثل حل مشاكل الرياضيات أو الترميز.

تسمى إحدى طرق الحصول على chatbots لتوليد المزيد من الاستجابات المفيدة “التعلم التعزيز من التعليقات البشرية” (RLHF) ، وهي تقنية رائدة من قبل Openai لتحسين ChatGPT.

يعمل RLHF من قبل المذيعين البشريين الذين يطلقون على استجابات نموذج الذكاء الاصطناعى للمطالبات واختيار الاستجابات الأفضل. غالبًا ما تكون هذه الخطوة شاقة ومكلفة وتستغرق وقتًا طويلاً ، وغالبًا ما تتطلب جيشًا صغيرًا من شركات البيانات البشرية.

يتمثل الابتكار الكبير لـ Deepseek في أتمتة هذه الخطوة الأخيرة ، باستخدام تقنية تسمى التعلم التعزيز (RL) ، حيث يتم مكافأة نموذج الذكاء الاصطناعي لفعل الشيء الصحيح.

طور Deepseek أولاً نموذجًا قويًا لإعداد النصوص يسمى V3. ثم استخدم RL “لمكافأة” النموذج ، مثل إعطائه إبهامًا لإنشاء الإجابة الصحيحة.

وجدت الشركة الصينية أنه من خلال القيام بهذه العملية مرات كافية ، تمكن النموذج من حل المشكلات تلقائيًا دون إشراف بشري.

تم استخدام هذه التقنية أيضًا من قبل Google DeepMind لبناء AlphaGo ، نظام الذكاء الاصطناعى الذي فاز على اللاعبين البشريين في لعبة اللوحة القديمة Go وبدأت الطفرة الحالية في تقنيات الحوسبة التعليمية العميقة قبل عقد من الزمان تقريبًا.

قالت Deepseek إنها اكتشفت أن النموذج كان لديه ما وصفته الشركة بـ “لحظة آها” عندما أعيد تقييم إجاباته وتعديل وقت المعالجة لحل الأسئلة المختلفة.

“إن” لحظة آها “بمثابة تذكير قوي بإمكانات (RL) لإطلاق مستويات جديدة من الذكاء في الأنظمة الاصطناعية ، مما يمهد الطريق لنماذج أكثر استقلالية وتكيفية في المستقبل” ، كتب المبدعون في ديبسيك في ورقة البحث الخاصة بهم.

وقال لويس تونستال ، الباحث في شركة Hugging Face ، وهي شركة أبحاث منظمة العفو الدولية: “يبدو أن الصلصة السرية لجعل هذا العمل هي مجرد نموذج قوي للغاية تم تدريبه مسبقًا ، ثم الحصول على جيد جدًا جدًا ، جيد جدًا جدًا ، جيد جدًا جدًا. البنية التحتية للقيام بعملية التعلم التعزيز هذه على نطاق واسع. “

نماذج صغيرة مصممة باستخدام تلك الكبيرة

بينما تستثمر Openai و Google مليارات الدولارات لبناء نماذج لغوية كبيرة ، قام Deepseek أيضًا ببناء نماذج أصغر يمكن تشغيلها على الهواتف أو متصفحات الويب من خلال “تقطير” إمكانات التفكير في النماذج الأكبر.

استخدم Deepseek نموذج R1 الخاص به لإنشاء مجموعة صغيرة نسبيًا من 800000 نقطة بيانات ، ثم قامت بتعديل النماذج التي صنعها منافسون مثل Qwen's Qwen و Meta's باستخدام البيانات التي تم إنشاؤها من الذكاء الاصطناعى.

وجدت Deepseek أن هذه النماذج المقطرة كانت قوية بشكل خاص في معايير التفكير ، في بعض الحالات تفوق نماذج الرائدة مثل كلود الأنثروبور. وقال تونستال: “يمكن أن يحل معظم مشاكل الرياضيات التي واجهتها في المرحلة الجامعية الأولى”.

يمكن أن يكون هذا التطور بمثابة نعمة لمطوري التطبيقات ، الذين لديهم طريقة رخيصة وفعالة لبناء المنتجات. تعليم نماذج الذكاء الاصطناعى العقل أثناء “الاستدلال”-عندما يولد النموذج إجابات-يكون أكثر كفاءة من عملية التدريب المسبق ، والتي تتطلب الكثير من قوة الحوسبة ، وفقًا لما ذكره Lennart Heim ، وهو باحث في Rand ، وهو عبارة .

وأضاف أن هذا النموذج الجديد يمكن أن يسمح للمنافسين ببناء نماذج تنافسية بقوة الحوسبة والمال. ومع ذلك ، بدون أموال للرقائق ، “لا يمكنهم نشرها على نفس الحجم” ، قال هايم.

لم يقل Deepseek المبلغ الذي أنفقه لبناء R1 ، لكنه ادعى أنه قام بتدريب نموذج V3 الخاص به ، والذي يعتمد R1 ، مقابل 5.6 مليون دولار فقط.

هذا المبلغ لا يشمل التكاليف الأخرى ، مثل الاستحواذ المحتمل لآلاف وحدات معالجة الرسومات لتدريب النموذج ، أو الرواتب ، والتجارب ، والتدريب والنشر.

وعلى الرغم من أن Deepseek كان أول من استخدم تقنياتها الخاصة ، من المتوقع أن تحذو حذو مختبرات الذكاء الاصطناعي الأخرى ، مع وجود وجه معانقة يعمل بالفعل على تكرار R1.

عملت شركات AI الأمريكية أيضًا على استخدام قدراتها على النماذج الكبيرة المنتشرة في نماذج أصغر وأكثر ذكاءً. أطلقت Google Gemma العام الماضي ، وهو نموذج أكثر خفيفة الوزن يعتمد على Gemini.

يقول توماس وولف ، المؤسس المشارك وكبير مسؤولي العلوم في Hugging Face ، مضيفًا أن تقنيات Deepseek كانت مفهومة جيدًا من قبل الآخرين في هذا المجال: “وصفة الذكاء بسيطة للغاية” ، مضيفًا أن تقنيات Deepseek كانت مفهومة جيدًا من قبل الآخرين في هذا المجال. “وهذا هو السبب في أنني أتوقع أن تتمكن الكثير من الفرق من إعادة هذا الأمر.”

شارك في تقارير إضافية من كريستينا كريدل في سان فرانسيسكو ومادووميتا مورجيا في لندن

فريق التحرير يناير 29, 2025 يناير 29, 2025
شارك المقال
فيسبوك تويتر واتساب واتساب نسخ الرابط طباعة
شارك
المقال السابق تعرف على موعد صرف مستحقات لاعبي الزمالك
المقال التالي للعام الثاني علي التوالي.. بسمة بالحجاب في مسلسلها الرمضاني “ظلم المصاطب”
اترك تعليقك اترك تعليقك

اترك تعليقاً إلغاء الرد

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

تابع معنا اخر الاخبار لحظة بلحظة واطلع على ما يحدث في العالم من حولك

ابق على إطلاع

اخر مستجدات العالم لحظة بلحظة من جميع المصادر الموثوقة، انضم الينا الآن ليصلك كل جديد.

اشترك الآن

رائج اليوم

استفتاء ضريبة الميراث spooks swiss super-rich

فتح Digest محرر مجانًاتختار رولا خالاف ، محررة FT ، قصصها المفضلة في هذه النشرة…

شركات منذ يومين

أحداث لوس أنجلوس تلقي بظلالها| توتر جديد بين البيت الأبيض وولاية كاليفورنيا.. تفاصيل كاملة

في مشهد قضائي يحمل أبعادا دستورية وسياسية عميقة، أثار قرار محكمة استئناف أمريكية الجدل من…

منوعات منذ يومين

كيف أصبحت تاكوما ، واشنطن القاتل التسلسلي الكابيتول لأمريكا

في عام 1996 ، اعترف جاك Spillman (A K A the Werewolf Butcher) بقتل ثلاثة…

منوعات منذ يومين

ينعكس مساعد رئيس فريدريكتون نائب رئيس الإطفاء في مسيرته المهنية لمدة 35 عامًا

كان ديفيد ماكينلي يبلغ من العمر 25 عامًا عندما انضم إلى إدارة إطفاء فريدريكتون لأول…

كندا منذ يومين

لإجلاء مواطنيها.. أستراليا تعلن نشر عسكريين وطائرات في الشرق الأوسط

نقلت وكالة أنباء رويترز عن وزيرة الخارجية الأسترالية، بيني وانج القول إنه سيتم نشر  عسكريين…

منوعات منذ 3 أيام

اكتشف المزيد

  • صورة اليوم
  • مقالات رأي
  • اخر الاخبار
  • رائج اليوم
  • النشرة البريدية

مقالات ذات صلة

ترامب يجذبنا إلى حرب الشرق الأوسط آخر

شركات

يقول ليتوانيا إن سرية حلف الناتو لإقناع الناخبين بالإنفاق الدفاعي

شركات

عطاءات الصناعة “Riddance” لقواعد SEC

شركات

يصطدم Starbucks Barista Union Recruitment مع شركة توظيف الشركة

شركات

صانع أشباه الموصلات الأمريكية wolfspeed لتقديم طلب للإفلاس

شركات

تخفيض أسعار الطاقة للأعمال كجزء من الإستراتيجية الصناعية في المملكة المتحدة

شركات

تسلا تطلق خدمة robotaxi في أوستن

شركات

إصلاح اللقاح الأمريكي يثير القلق المستثمرين حيث يستولى المتشككون على المناصب الاستشارية

شركات
مصدرك الأول لآخر الاخبار العالمية
Facebook Twitter Youtube Instagram Linkedin

2023 © المراقب. جميع الحقوق محفوظة.

روابط هامة

  • الرئيسية
  • من نحن
  • سياسة الخصوصية
  • اعلن معنا
  • اتصل بنا

أهم الأقسام

  • ثقافة وفنون
  • سياحة وسفر
  • سياسة
  • صحة
  • اقتصاد

نرشح لك

صلاة الضحى.. اعرف وقتها وعدد ركعاتها والسور التي تقرأ فيها
أولمرت: الضربة الأميركية لإيران منحت نتنياهو فرصة لن يفلح باستغلالها
ترامب يجذبنا إلى حرب الشرق الأوسط آخر

صحيفة المراقب هي صحيفة يومية عربية تهتم بآخر اخبار المملكة العربية السعودية والخليج العربي والشرق الأوسط والعالم. تابع معنا اخر اخبار الاقتصاد والرياضة والسياسة واهم القضايا التي تهم المواطن العربي.

Welcome Back!

Sign in to your account

نسيت كلمة المرور؟