باستخدام هذا الموقع ، فإنك توافق على سياسة الخصوصية و شروط الاستخدام .
القبول

انضم الى قائمة المتابعين لتصلك جميع الاخبار مباشرة. اشترك الآن

الخليج ترند
  • الرئيسية
  • اخر الاخبار
  • دوليات
    • الولايات المتحدة
    • اوروبا
    • اسيا
    • كندا
    • افريقيا
  • اقتصاد
    • اسواق
    • شركات
    • الاستثمار
    • العملات المشفرة
  • سياسة

    سياسة

    سياسة

    الرجل المتهم بمحاولة اغتيال ترامب يطلب من القاضية إيلين كانون التنحي عن قضيته

    يطلب الرجل المتهم بالجلوس خلف سياج متصل بسلسلة على حدود ملعب الغولف التابع لدونالد ترامب في فلوريدا ومعه بندقية، بزعم…

    سياسة

    هابرمان: أصبحت لغة ترامب أكثر قتامة

    هابرمان: أصبحت لغة ترامب أكثر قتامة تقول المحللة السياسية لشبكة CNN، ماجي هابرمان، إن لغة الرئيس السابق دونالد ترامب خلال…

    سياسة

    بالنسبة لبايدن، فإن وفاة السنوار تضخ حالة من عدم اليقين – ولكنها أيضًا تفتح بابًا – لحل الصراع في غزة

    على مدار أشهر، ظل المسؤولون الأمريكيون المحبطون الذين يتطلعون إلى إنهاء الحرب في غزة يفكرون بهدوء في السيناريو الوحيد الذي…

    سياسة

    سيتم منح المواطنين اللبنانيين الذين يعيشون في الولايات المتحدة إغاثة إنسانية مع استمرار الصراع بين إسرائيل وحزب الله

    أعلنت وزارة الأمن الداخلي اليوم الخميس، أن المواطنين اللبنانيين المقيمين في الولايات المتحدة سيحصلون على شكل من أشكال الإغاثة الإنسانية،…

  • تقنية
  • رياضة
  • صحة
  • منوعات

    منوعات

    منوعات

    برلماني: وثيقة ملكية الدولة تحتاج إلى قراءة أخرى وإدراج أفكار مختلفة

    أكد النائب محمود سامي مقرر مساعد لجنة أولويات الاستثمارات بالحوار الوطني، أن الحوار الوطني جزء من الحوارات المستمرة دائماً في…

    منوعات

    البيان المالى: الشفافية المالية عززت حصد المركز الأول في الموازنة المفتوحة – منوعات

    أكد البيان المالي للعام المالي الجديد 2023/2024 ، المقدم من الدكتور محمد معيط إلى مجلس النواب برئاسة المستشار الدكتور حنفي…

    من هي زوجة اليو ديانج

    أثير الاهتمام العام بهوية زوجة اللاعب المالي الشهير أليو ديانغ. واتضح أن حفل زفافه أقيم في وقت سابق من العام…

    منوعات

    محافظ الوادي الجديد: نشارك بـ 182 مشروعًا في مبادرة «الخضراء الذكية»

    قال اللواء محمد الزملوط محافظ الوادي الجديد، إن إجمالي المشروعات المتقدمة للمشاركة في الدورة الثانية من المبادرة الوطنية للمشروعات الخضراء…

  • المزيد
    • ثقافة وفنون
    • سياحة وسفر
اشترك معنا
Aa
الخليج ترند
  • اخر الاخبار
  • دوليات
  • سياسة
  • اقتصاد
  • صحة
  • تقنية
  • ثقافة وفنون
  • رياضة
  • سياحة وسفر
  • منوعات
البحث
  • الرئيسية
  • اخر الاخبار
  • دوليات
    • الولايات المتحدة
    • اوروبا
    • اسيا
    • كندا
    • افريقيا
  • اقتصاد
    • اسواق
    • شركات
    • الاستثمار
    • العملات المشفرة
  • سياسة
  • تقنية
  • رياضة
  • صحة
  • منوعات
  • المزيد
    • ثقافة وفنون
    • سياحة وسفر
banner
ابق على إطلاع دائم
اخر مستجدات العالم لحظة بلحظة من جميع المصادر الموثوقة، انضم الينا الآن ليصلك كل جديد الى بريدك الإلكتروني مباشرة.
اشترك الآن

اكتشف المزيد

  • صورة اليوم
  • مقالات رأي
  • اخر الاخبار
  • رائج اليوم
  • ألنشرة البريدية
2023 © المراقب. جميع الحقوق محفوظة.
الخليج ترند > اقتصاد > شركات > يجعل الأنثروبور تقدمًا “Jailbreak” لوقف نماذج الذكاء الاصطناعى التي تنتج نتائج ضارة

يجعل الأنثروبور تقدمًا “Jailbreak” لوقف نماذج الذكاء الاصطناعى التي تنتج نتائج ضارة

فريق التحرير كتب فريق التحرير منذ 4 أشهر 4 دقيقة للقراءة
شارك

ابق على اطلاع مع التحديثات المجانية

ببساطة الاشتراك في الذكاء الاصطناعي Myft Digest – يتم تسليمها مباشرة إلى صندوق الوارد الخاص بك.

أظهرت شركة Antromcence STARTATION STARTEMENCE STARTEMENCE تقنية جديدة لمنع المستخدمين من إثارة محتوى ضار من نماذجه ، حيث أن مجموعات التكنولوجيا الرائدة بما في ذلك Microsoft و META RACE لإيجاد طرق تحمي من المخاطر التي تشكلها التكنولوجيا المتطورة.

في ورقة صدرت يوم الاثنين ، حددت الشركة الناشئة التي تتخذ من سان فرانسيسكو مقراً لها نظامًا جديدًا يسمى “المصنفات الدستورية”. إنه نموذج يعمل كطبقة وقائية على رأس نماذج اللغة الكبيرة مثل النموذج الذي يعمل على تشغيل chatbot من الأنثروبور ، والذي يمكنه مراقبة كل من المدخلات والمخرجات للمحتوى الضار.

ويأتي تطور الأنثروبور ، الذي يجري محادثات لجمع 2 مليار دولار بتقييم 60 مليار دولار ، وسط قلق في الصناعة المتزايدة بشأن “كسر الحماية” – محاولات لمعالجة نماذج الذكاء الاصطناعي لتوليد معلومات غير قانونية أو خطيرة ، مثل إنتاج تعليمات لبناء أسلحة كيميائية.

تتسابق الشركات الأخرى أيضًا لنشر تدابير للحماية من هذه الممارسة ، في التحركات التي يمكن أن تساعدهم على تجنب التدقيق التنظيمي مع إقناع الشركات بتبني نماذج الذكاء الاصطناعي بأمان. قدمت Microsoft “دروع موجهة” في مارس الماضي ، في حين قدم Meta نموذج حارس سريع في يوليو من العام الماضي ، والذي وجد الباحثون بسرعة طرقًا لتجاوزه ولكن تم إصلاحه منذ ذلك الحين.

وقال Mrinank Sharma ، وهو عضو من الموظفين التقنيين في الإنسان: “كان الدافع الرئيسي وراء العمل هو لأشياء كيميائية شديدة (الأسلحة) (ولكن) الميزة الحقيقية للطريقة هي قدرتها على الاستجابة بسرعة والتكيف.”

وقالت الأنثروبور إنها لن تستخدم النظام على الفور في نماذج كلود الحالية ولكنها ستنظر في تنفيذها إذا تم إصدار نماذج أكثر خطورة في المستقبل. وأضاف شارما: “الوجبات الجاهزة من هذا العمل هي أننا نعتقد أن هذه مشكلة قابلة للتركيب.”

تم بناء الحل المقترح لبدء التشغيل على ما يسمى “دستور” من القواعد التي تحدد ما هو مسموح به وتقييده ويمكن تكييفه لالتقاط أنواع مختلفة من المواد.

تعتبر بعض محاولات السجن معروفة ، مثل استخدام الرسملة غير العادية في المطالبة أو مطالبة النموذج بتبني شخصية الجدة لإخبار قصة بجانب السرير عن موضوع شرير.

للتحقق من فعالية النظام ، عرضت الأنثروبور “مكافآت الأخطاء” التي تصل إلى 15000 دولار للأفراد الذين حاولوا تجاوز التدابير الأمنية. قضى هؤلاء المختبرين ، المعروفين باسم الفرق الحمراء ، أكثر من 3000 ساعة في محاولة لاختراق الدفاعات.

ورفض نموذج كلود 3.5 Sonnet الأنثروبري أكثر من 95 في المائة من المحاولات مع المصنفات المعمول بها ، مقارنة بنسبة 14 في المائة دون ضمانات.

تحاول شركات التكنولوجيا الرائدة تقليل سوء استخدام نماذجها ، مع الحفاظ على مساعدتها. في كثير من الأحيان ، عندما يتم وضع تدابير الاعتدال في مكانها ، يمكن أن تصبح النماذج حذرة وترفض الطلبات الحميدة ، كما هو الحال مع الإصدارات المبكرة من مولد صور الجوزاء في Google أو LAMA 2. “.

ومع ذلك ، فإن إضافة هذه الحماية تتحمل أيضًا تكاليف إضافية للشركات التي تدفع بالفعل مبالغ ضخمة لحساب الطاقة المطلوبة لتدريب وتشغيل النماذج. وقالت الأنثروبور إن المصنف سيصل إلى زيادة بنسبة 24 في المائة تقريبًا في “النفقات العامة للاستدلال” ، وتكاليف إدارة النماذج.

جادل خبراء الأمن بأن الطبيعة التي يمكن الوصول إليها لمثل هذه الدردشة التوليدية قد مكنت الأشخاص العاديين دون معرفة مسبقة لمحاولة استخراج المعلومات الخطرة.

وقال رام شانكار سيفا كومار ، الذي يقود فريق AI Red في Microsoft: “في عام 2016 ، كان ممثل التهديد الذي كنا نأخذه في الاعتبار خصمًا قويًا للدولة القومية”. “الآن حرفيًا أحد ممثلي التهديد هو مراهق ذو فم قعادة.”

فريق التحرير فبراير 3, 2025 فبراير 3, 2025
شارك المقال
فيسبوك تويتر واتساب واتساب نسخ الرابط طباعة
شارك
المقال السابق أوبك تسقط إدارة معلومات الطاقة الأمريكية كمراقبة البيانات
المقال التالي قطر تطلق جسرا جويا من الأردن لتوفير مساعدات طبية لغزة
اترك تعليقك اترك تعليقك

اترك تعليقاً إلغاء الرد

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

تابع معنا اخر الاخبار لحظة بلحظة واطلع على ما يحدث في العالم من حولك

ابق على إطلاع

اخر مستجدات العالم لحظة بلحظة من جميع المصادر الموثوقة، انضم الينا الآن ليصلك كل جديد.

اشترك الآن

رائج اليوم

حملة تضليل رقمي.. من وراء شائعة الانقلاب في كوت ديفوار؟

في 21 مايو/أيار الجاري، اجتاحت وسائل التواصل الاجتماعي موجة غير مسبوقة من المنشورات التي تزعم…

اخر الاخبار منذ 22 ساعة

عملية ربط المعدة بالمنظار القابلة للتعديل في دبي وأبوظبي: الحل الذكي للسمنة مع د. عبد السلام الطائي

في ظل انتشار السمنة كمشكلة صحية عالمية، تبرز عملية ربط المعدة بالمنظار القابلة للتعديل كأحد الخيارات الأكثر…

صحة منذ 21 ساعة

يجب على مجلس الأمن التابع للأمم المتحدة تجديد حظر الأسلحة في جنوب السودان

في عام 2015 ، كحرب أهلية كانت مستعرة في جنوب السودان ، فرض مجلس الأمن…

افريقيا منذ يومين

Ritzy ، مطعم المشاهير يبيع كوكتيلًا بقيمة 33 ألف دولار-ويأتي مع حقيبة بيركين

إنه رف أعلى وأعلى خط. أرسل مطعم حصري في ميامي الكثير إلى دوامة بعد الكشف…

منوعات منذ يومين

تسونامي يضرب إسرائيل .. جيش الاحتلال يستعد لحدث يزلزل تل أبيب

يستعد جيش الاحتلال لمواجهة تسونامي يضرب إسرائيل، بعد الزلازل التي ضربت اليونان خلال الأسابيع الماضية،…

منوعات منذ يومين

اكتشف المزيد

  • صورة اليوم
  • مقالات رأي
  • اخر الاخبار
  • رائج اليوم
  • النشرة البريدية

مقالات ذات صلة

يشكل فاتورة الضرائب لترامب تهديدًا وجوديًا لصناعة الهيدروجين الخضراء الأمريكية

شركات

طابور أمريكيون رخيصة التضخم لورق المرحاض والبوردو الرخيصة

شركات

تتحول الجمعيات الخيرية الفرنسية إلى المحربين في المملكة المتحدة بينما تتراجع الدولة في المنزل

شركات

هارغريفز لانسداون رئيس دان أوللي للمغادرة بعد قضاء عامين

شركات

مؤسس دافوس كلاوس شواب يطلق شكوى جنائية ضد المتهمين

شركات

يحث وزير الاقتصاد الألماني بروكسل على دعم خطة الدعم للصناعة الثقيلة

شركات

طفرة الإقراض في ظل الظل البالغة دولار واحد

شركات

ما يمكن أن يتعلمه NHS من الفورمولا 1

شركات
مصدرك الأول لآخر الاخبار العالمية
Facebook Twitter Youtube Instagram Linkedin

2023 © المراقب. جميع الحقوق محفوظة.

روابط هامة

  • الرئيسية
  • من نحن
  • سياسة الخصوصية
  • اعلن معنا
  • اتصل بنا

أهم الأقسام

  • ثقافة وفنون
  • سياحة وسفر
  • سياسة
  • صحة
  • اقتصاد

نرشح لك

الأزمة الإنسانية تتفاقم بقطاع غزة مع تراجع عدد التكايا
صرف الإسكندرية: تنفيذ حملات توعية للتخلص السليم من مخلفات الأضاحي
ضبط 420 بطاقة تموينية بأحد المخابز البلدية وربع طن دقيق بلدى مدعم بالأقصر

صحيفة المراقب هي صحيفة يومية عربية تهتم بآخر اخبار المملكة العربية السعودية والخليج العربي والشرق الأوسط والعالم. تابع معنا اخر اخبار الاقتصاد والرياضة والسياسة واهم القضايا التي تهم المواطن العربي.

Welcome Back!

Sign in to your account

نسيت كلمة المرور؟