باستخدام هذا الموقع ، فإنك توافق على سياسة الخصوصية و شروط الاستخدام .
القبول

انضم الى قائمة المتابعين لتصلك جميع الاخبار مباشرة. اشترك الآن

الخليج ترند
  • الرئيسية
  • اخر الاخبار
  • دوليات
    • الولايات المتحدة
    • اوروبا
    • اسيا
    • كندا
    • افريقيا
  • اقتصاد
    • اسواق
    • شركات
    • الاستثمار
    • العملات المشفرة
  • سياسة

    سياسة

    سياسة

    الرجل المتهم بمحاولة اغتيال ترامب يطلب من القاضية إيلين كانون التنحي عن قضيته

    يطلب الرجل المتهم بالجلوس خلف سياج متصل بسلسلة على حدود ملعب الغولف التابع لدونالد ترامب في فلوريدا ومعه بندقية، بزعم…

    سياسة

    هابرمان: أصبحت لغة ترامب أكثر قتامة

    هابرمان: أصبحت لغة ترامب أكثر قتامة تقول المحللة السياسية لشبكة CNN، ماجي هابرمان، إن لغة الرئيس السابق دونالد ترامب خلال…

    سياسة

    بالنسبة لبايدن، فإن وفاة السنوار تضخ حالة من عدم اليقين – ولكنها أيضًا تفتح بابًا – لحل الصراع في غزة

    على مدار أشهر، ظل المسؤولون الأمريكيون المحبطون الذين يتطلعون إلى إنهاء الحرب في غزة يفكرون بهدوء في السيناريو الوحيد الذي…

    سياسة

    سيتم منح المواطنين اللبنانيين الذين يعيشون في الولايات المتحدة إغاثة إنسانية مع استمرار الصراع بين إسرائيل وحزب الله

    أعلنت وزارة الأمن الداخلي اليوم الخميس، أن المواطنين اللبنانيين المقيمين في الولايات المتحدة سيحصلون على شكل من أشكال الإغاثة الإنسانية،…

  • تقنية
  • رياضة
  • صحة
  • منوعات

    منوعات

    امتحانات الثانوية العامة 2023| الطلاب يتوافدون على اللجان لأداء الفيزياء والتاريخ

    يتوافد الآن طلاب الثانوية العامة 2023 الشعبة العلمية والشعبة الأدبية على لجان امتحانات الثانوية العامة 2023 الموجودة على مستوى الجمهورية…

    منوعات

    “بيخلط روشن خلط” بعد انفجار اللاعب في زينيت.. مالكوم جناح برشلونة السابق إلى الهلال!

    بدأ اللاعب البرازيلي "مالكوم فيلبي سيلفا" صاحب الـ 26 عامًا مسيرته الكروية في فريق كورينثيانز البرازيلي في عام 2016م. بعد…

    منوعات

    بتهمة غسيل الأموال.. مصرف الإمارات المركزي يفرض عقوبات على شركة مصرفية

    فرض مصرف الإمارات العربية المتحدة المركزي، عقوبة مالية على شركة صرافة عاملة في الدولة، بتهمة غسيل الأموال ومكافحة تمويل الإرهاب…

    منوعات

    بدء التنسيق الداخلى لأقسام كلية الآداب بجامعة عين شمس 2023-2024

    بدأت يوم الأحد ٣ سبتمبر ٢٠٢٣ أعمال التنسيق الداخلي بكلية الآداب جامعة عين شمس للطلاب الجدد وتسجيل رغباتهم لأقسام الكلية…

  • المزيد
    • ثقافة وفنون
    • سياحة وسفر
اشترك معنا
Aa
الخليج ترند
  • اخر الاخبار
  • دوليات
  • سياسة
  • اقتصاد
  • صحة
  • تقنية
  • ثقافة وفنون
  • رياضة
  • سياحة وسفر
  • منوعات
البحث
  • الرئيسية
  • اخر الاخبار
  • دوليات
    • الولايات المتحدة
    • اوروبا
    • اسيا
    • كندا
    • افريقيا
  • اقتصاد
    • اسواق
    • شركات
    • الاستثمار
    • العملات المشفرة
  • سياسة
  • تقنية
  • رياضة
  • صحة
  • منوعات
  • المزيد
    • ثقافة وفنون
    • سياحة وسفر
banner
ابق على إطلاع دائم
اخر مستجدات العالم لحظة بلحظة من جميع المصادر الموثوقة، انضم الينا الآن ليصلك كل جديد الى بريدك الإلكتروني مباشرة.
اشترك الآن

اكتشف المزيد

  • صورة اليوم
  • مقالات رأي
  • اخر الاخبار
  • رائج اليوم
  • ألنشرة البريدية
2023 © المراقب. جميع الحقوق محفوظة.
الخليج ترند > اقتصاد > شركات > يجعل الأنثروبور تقدمًا “Jailbreak” لوقف نماذج الذكاء الاصطناعى التي تنتج نتائج ضارة

يجعل الأنثروبور تقدمًا “Jailbreak” لوقف نماذج الذكاء الاصطناعى التي تنتج نتائج ضارة

فريق التحرير كتب فريق التحرير منذ 5 أشهر 4 دقيقة للقراءة
شارك

ابق على اطلاع مع التحديثات المجانية

ببساطة الاشتراك في الذكاء الاصطناعي Myft Digest – يتم تسليمها مباشرة إلى صندوق الوارد الخاص بك.

أظهرت شركة Antromcence STARTATION STARTEMENCE STARTEMENCE تقنية جديدة لمنع المستخدمين من إثارة محتوى ضار من نماذجه ، حيث أن مجموعات التكنولوجيا الرائدة بما في ذلك Microsoft و META RACE لإيجاد طرق تحمي من المخاطر التي تشكلها التكنولوجيا المتطورة.

في ورقة صدرت يوم الاثنين ، حددت الشركة الناشئة التي تتخذ من سان فرانسيسكو مقراً لها نظامًا جديدًا يسمى “المصنفات الدستورية”. إنه نموذج يعمل كطبقة وقائية على رأس نماذج اللغة الكبيرة مثل النموذج الذي يعمل على تشغيل chatbot من الأنثروبور ، والذي يمكنه مراقبة كل من المدخلات والمخرجات للمحتوى الضار.

ويأتي تطور الأنثروبور ، الذي يجري محادثات لجمع 2 مليار دولار بتقييم 60 مليار دولار ، وسط قلق في الصناعة المتزايدة بشأن “كسر الحماية” – محاولات لمعالجة نماذج الذكاء الاصطناعي لتوليد معلومات غير قانونية أو خطيرة ، مثل إنتاج تعليمات لبناء أسلحة كيميائية.

تتسابق الشركات الأخرى أيضًا لنشر تدابير للحماية من هذه الممارسة ، في التحركات التي يمكن أن تساعدهم على تجنب التدقيق التنظيمي مع إقناع الشركات بتبني نماذج الذكاء الاصطناعي بأمان. قدمت Microsoft “دروع موجهة” في مارس الماضي ، في حين قدم Meta نموذج حارس سريع في يوليو من العام الماضي ، والذي وجد الباحثون بسرعة طرقًا لتجاوزه ولكن تم إصلاحه منذ ذلك الحين.

وقال Mrinank Sharma ، وهو عضو من الموظفين التقنيين في الإنسان: “كان الدافع الرئيسي وراء العمل هو لأشياء كيميائية شديدة (الأسلحة) (ولكن) الميزة الحقيقية للطريقة هي قدرتها على الاستجابة بسرعة والتكيف.”

وقالت الأنثروبور إنها لن تستخدم النظام على الفور في نماذج كلود الحالية ولكنها ستنظر في تنفيذها إذا تم إصدار نماذج أكثر خطورة في المستقبل. وأضاف شارما: “الوجبات الجاهزة من هذا العمل هي أننا نعتقد أن هذه مشكلة قابلة للتركيب.”

تم بناء الحل المقترح لبدء التشغيل على ما يسمى “دستور” من القواعد التي تحدد ما هو مسموح به وتقييده ويمكن تكييفه لالتقاط أنواع مختلفة من المواد.

تعتبر بعض محاولات السجن معروفة ، مثل استخدام الرسملة غير العادية في المطالبة أو مطالبة النموذج بتبني شخصية الجدة لإخبار قصة بجانب السرير عن موضوع شرير.

للتحقق من فعالية النظام ، عرضت الأنثروبور “مكافآت الأخطاء” التي تصل إلى 15000 دولار للأفراد الذين حاولوا تجاوز التدابير الأمنية. قضى هؤلاء المختبرين ، المعروفين باسم الفرق الحمراء ، أكثر من 3000 ساعة في محاولة لاختراق الدفاعات.

ورفض نموذج كلود 3.5 Sonnet الأنثروبري أكثر من 95 في المائة من المحاولات مع المصنفات المعمول بها ، مقارنة بنسبة 14 في المائة دون ضمانات.

تحاول شركات التكنولوجيا الرائدة تقليل سوء استخدام نماذجها ، مع الحفاظ على مساعدتها. في كثير من الأحيان ، عندما يتم وضع تدابير الاعتدال في مكانها ، يمكن أن تصبح النماذج حذرة وترفض الطلبات الحميدة ، كما هو الحال مع الإصدارات المبكرة من مولد صور الجوزاء في Google أو LAMA 2. “.

ومع ذلك ، فإن إضافة هذه الحماية تتحمل أيضًا تكاليف إضافية للشركات التي تدفع بالفعل مبالغ ضخمة لحساب الطاقة المطلوبة لتدريب وتشغيل النماذج. وقالت الأنثروبور إن المصنف سيصل إلى زيادة بنسبة 24 في المائة تقريبًا في “النفقات العامة للاستدلال” ، وتكاليف إدارة النماذج.

جادل خبراء الأمن بأن الطبيعة التي يمكن الوصول إليها لمثل هذه الدردشة التوليدية قد مكنت الأشخاص العاديين دون معرفة مسبقة لمحاولة استخراج المعلومات الخطرة.

وقال رام شانكار سيفا كومار ، الذي يقود فريق AI Red في Microsoft: “في عام 2016 ، كان ممثل التهديد الذي كنا نأخذه في الاعتبار خصمًا قويًا للدولة القومية”. “الآن حرفيًا أحد ممثلي التهديد هو مراهق ذو فم قعادة.”

فريق التحرير فبراير 3, 2025 فبراير 3, 2025
شارك المقال
فيسبوك تويتر واتساب واتساب نسخ الرابط طباعة
شارك
المقال السابق أوبك تسقط إدارة معلومات الطاقة الأمريكية كمراقبة البيانات
المقال التالي قطر تطلق جسرا جويا من الأردن لتوفير مساعدات طبية لغزة
اترك تعليقك اترك تعليقك

اترك تعليقاً إلغاء الرد

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

تابع معنا اخر الاخبار لحظة بلحظة واطلع على ما يحدث في العالم من حولك

ابق على إطلاع

اخر مستجدات العالم لحظة بلحظة من جميع المصادر الموثوقة، انضم الينا الآن ليصلك كل جديد.

اشترك الآن

رائج اليوم

رويترز: البيت الأبيض يريد خفضا كبيرا لتمويل برامج التحقيق بجرائم الحرب

26/6/2025-|آخر تحديث: 22:46 (توقيت مكة)كشف مصدران أميركيان مطلعان ووثائق حكومية داخلية اطلعت عليها وكالة رويترز…

اخر الاخبار منذ يومين

شهداء بغارات إسرائيلية على خيام النازحين ومنتظري المساعدات بغزة

26/6/2025-|آخر تحديث: 13:06 (توقيت مكة)جددت قوات الاحتلال الإسرائيلي قصفها على مواقع مختلفة من قطاع غزة…

اخر الاخبار منذ 3 أيام

أجب على الأسئلة حول السياسة والشراكات في مسابقة Fox News لهذا الأسبوع

ما هي أفضل سياسي في نيويورك فقدت الانتخابات التمهيدية لعملية الاشتراكية الديمقراطية؟ ما هي سلسلة…

منوعات منذ يومين

يقول ترامب إنه “يأمل” أن يقدم المؤتمر “مشروع قانون جميل كبير” للاحتفال في الرابع من يوليو

واشنطن - قال الرئيس ترامب يوم الخميس إنه لا يزال يأمل في توقيع "مشروع قانونه…

دوليات منذ يومين

محادثات خلف الكواليس.. حوافز مغرية لإيران مقابل وقف التخصيب

26/6/2025-|آخر تحديث: 23:13 (توقيت مكة)نقلت شبكة "سي إن إن" عن مصادر مطلعة أن إدارة الرئيس…

اخر الاخبار منذ يومين

اكتشف المزيد

  • صورة اليوم
  • مقالات رأي
  • اخر الاخبار
  • رائج اليوم
  • النشرة البريدية

مقالات ذات صلة

الضغط على صناعة الكحول “قد يؤذي الآخرين – وليس نحن”

شركات

يتذكر التصويت البلدية الغريب في نيويورك تقاليد الشركات المفقودة

شركات

يستثمر المستثمرون المشفرون في كوريا الجنوبية سوقًا أفضل الأداء في آسيا

شركات

المديرين التنفيذيين في NVIDIA صرف سهم 1 مليار دولار من الأسهم

شركات

يعزز الدجاج هيمنته على السلسلة الغذائية الأمريكية

شركات

الشركات متعددة الجنسيات الأمريكية على المسار الصحيح للحصول على الحد الأدنى من الإعفاء الضريبي بعد صفقة G7

شركات

الشركات متعددة الجنسيات الأمريكية على المسار الصحيح للحصول على الحد الأدنى من الإعفاء الضريبي بعد صفقة G7

شركات

يواجه الولايات المتحدة لركوب الدراجات عواقب “مدمرة” من الحرب التجارية

شركات
مصدرك الأول لآخر الاخبار العالمية
Facebook Twitter Youtube Instagram Linkedin

2023 © المراقب. جميع الحقوق محفوظة.

روابط هامة

  • الرئيسية
  • من نحن
  • سياسة الخصوصية
  • اعلن معنا
  • اتصل بنا

أهم الأقسام

  • ثقافة وفنون
  • سياحة وسفر
  • سياسة
  • صحة
  • اقتصاد

نرشح لك

صدام إنتر ميامي وباريس.. مواعيد مباريات اليوم الأحد 29-6-2025 والقنوات الناقلة
كايلا راي ريد تذكر نفسها بـ “البقاء على قيد الحياة” ثم “تزدهر” وسط طلاق ريان لوختي ، ديون
الليلة.. مصر تواجه ألمانيا ببطولة العالم لشباب كرة اليد تحت 21 سنة

صحيفة المراقب هي صحيفة يومية عربية تهتم بآخر اخبار المملكة العربية السعودية والخليج العربي والشرق الأوسط والعالم. تابع معنا اخر اخبار الاقتصاد والرياضة والسياسة واهم القضايا التي تهم المواطن العربي.

Welcome Back!

Sign in to your account

نسيت كلمة المرور؟