باستخدام هذا الموقع ، فإنك توافق على سياسة الخصوصية و شروط الاستخدام .
القبول

انضم الى قائمة المتابعين لتصلك جميع الاخبار مباشرة. اشترك الآن

الخليج ترند
  • الرئيسية
  • اخر الاخبار
  • دوليات
    • الولايات المتحدة
    • اوروبا
    • اسيا
    • كندا
    • افريقيا
  • اقتصاد
    • اسواق
    • شركات
    • الاستثمار
    • العملات المشفرة
  • سياسة

    سياسة

    سياسة

    الرجل المتهم بمحاولة اغتيال ترامب يطلب من القاضية إيلين كانون التنحي عن قضيته

    يطلب الرجل المتهم بالجلوس خلف سياج متصل بسلسلة على حدود ملعب الغولف التابع لدونالد ترامب في فلوريدا ومعه بندقية، بزعم…

    سياسة

    هابرمان: أصبحت لغة ترامب أكثر قتامة

    هابرمان: أصبحت لغة ترامب أكثر قتامة تقول المحللة السياسية لشبكة CNN، ماجي هابرمان، إن لغة الرئيس السابق دونالد ترامب خلال…

    سياسة

    بالنسبة لبايدن، فإن وفاة السنوار تضخ حالة من عدم اليقين – ولكنها أيضًا تفتح بابًا – لحل الصراع في غزة

    على مدار أشهر، ظل المسؤولون الأمريكيون المحبطون الذين يتطلعون إلى إنهاء الحرب في غزة يفكرون بهدوء في السيناريو الوحيد الذي…

    سياسة

    سيتم منح المواطنين اللبنانيين الذين يعيشون في الولايات المتحدة إغاثة إنسانية مع استمرار الصراع بين إسرائيل وحزب الله

    أعلنت وزارة الأمن الداخلي اليوم الخميس، أن المواطنين اللبنانيين المقيمين في الولايات المتحدة سيحصلون على شكل من أشكال الإغاثة الإنسانية،…

  • تقنية
  • رياضة
  • صحة
  • منوعات

    منوعات

    منوعات

    بعد تأكيد إيلون ماسك.. ما سر تغيير تسمية شركة تويتر لـ X

    أكد رجل الأعمال الأمريكي إيلون ماسك، عن خططه لتغيير اسم شركة موقع التواصل الاجتماعي تويتر Twitter، وهي عبارة عن تسمية…

    منوعات

    ضياء السيد: عروض لاعبي الأهلي منطقية ولكنها «مكافأة مؤلمة» للبطل

    أكد ضياء السيد المدرب العام السابق لمنتخب مصر، أن هناك ضغوط كبيرة في الوقت الراهن على النادي الأهلي؛ في ظل…

    منوعات

    شروط السفر من مطار الكويت 2023

    شروط السفر من مطار الكويت 2023. حيث تم وضع هذه الشروط حتى يستطيع كافة المواطنين والأجانب من الانطلاق في رحلاتهم…

    منوعات

    مصر تعزي اليونان في ضحايا مواجهة حرائق الغابات

    أعربت جمهورية مصر العربية، في بيان صادر عن وزارة الخارجية، عن خالص تعازيها وتضامنها مع جمهورية اليونان الصديقة، في مواجهة…

  • المزيد
    • ثقافة وفنون
    • سياحة وسفر
اشترك معنا
Aa
الخليج ترند
  • اخر الاخبار
  • دوليات
  • سياسة
  • اقتصاد
  • صحة
  • تقنية
  • ثقافة وفنون
  • رياضة
  • سياحة وسفر
  • منوعات
البحث
  • الرئيسية
  • اخر الاخبار
  • دوليات
    • الولايات المتحدة
    • اوروبا
    • اسيا
    • كندا
    • افريقيا
  • اقتصاد
    • اسواق
    • شركات
    • الاستثمار
    • العملات المشفرة
  • سياسة
  • تقنية
  • رياضة
  • صحة
  • منوعات
  • المزيد
    • ثقافة وفنون
    • سياحة وسفر
banner
ابق على إطلاع دائم
اخر مستجدات العالم لحظة بلحظة من جميع المصادر الموثوقة، انضم الينا الآن ليصلك كل جديد الى بريدك الإلكتروني مباشرة.
اشترك الآن

اكتشف المزيد

  • صورة اليوم
  • مقالات رأي
  • اخر الاخبار
  • رائج اليوم
  • ألنشرة البريدية
2023 © المراقب. جميع الحقوق محفوظة.
الخليج ترند > اقتصاد > شركات > يجعل الأنثروبور تقدمًا “Jailbreak” لوقف نماذج الذكاء الاصطناعى التي تنتج نتائج ضارة

يجعل الأنثروبور تقدمًا “Jailbreak” لوقف نماذج الذكاء الاصطناعى التي تنتج نتائج ضارة

فريق التحرير كتب فريق التحرير منذ 4 أشهر 4 دقيقة للقراءة
شارك

ابق على اطلاع مع التحديثات المجانية

ببساطة الاشتراك في الذكاء الاصطناعي Myft Digest – يتم تسليمها مباشرة إلى صندوق الوارد الخاص بك.

أظهرت شركة Antromcence STARTATION STARTEMENCE STARTEMENCE تقنية جديدة لمنع المستخدمين من إثارة محتوى ضار من نماذجه ، حيث أن مجموعات التكنولوجيا الرائدة بما في ذلك Microsoft و META RACE لإيجاد طرق تحمي من المخاطر التي تشكلها التكنولوجيا المتطورة.

في ورقة صدرت يوم الاثنين ، حددت الشركة الناشئة التي تتخذ من سان فرانسيسكو مقراً لها نظامًا جديدًا يسمى “المصنفات الدستورية”. إنه نموذج يعمل كطبقة وقائية على رأس نماذج اللغة الكبيرة مثل النموذج الذي يعمل على تشغيل chatbot من الأنثروبور ، والذي يمكنه مراقبة كل من المدخلات والمخرجات للمحتوى الضار.

ويأتي تطور الأنثروبور ، الذي يجري محادثات لجمع 2 مليار دولار بتقييم 60 مليار دولار ، وسط قلق في الصناعة المتزايدة بشأن “كسر الحماية” – محاولات لمعالجة نماذج الذكاء الاصطناعي لتوليد معلومات غير قانونية أو خطيرة ، مثل إنتاج تعليمات لبناء أسلحة كيميائية.

تتسابق الشركات الأخرى أيضًا لنشر تدابير للحماية من هذه الممارسة ، في التحركات التي يمكن أن تساعدهم على تجنب التدقيق التنظيمي مع إقناع الشركات بتبني نماذج الذكاء الاصطناعي بأمان. قدمت Microsoft “دروع موجهة” في مارس الماضي ، في حين قدم Meta نموذج حارس سريع في يوليو من العام الماضي ، والذي وجد الباحثون بسرعة طرقًا لتجاوزه ولكن تم إصلاحه منذ ذلك الحين.

وقال Mrinank Sharma ، وهو عضو من الموظفين التقنيين في الإنسان: “كان الدافع الرئيسي وراء العمل هو لأشياء كيميائية شديدة (الأسلحة) (ولكن) الميزة الحقيقية للطريقة هي قدرتها على الاستجابة بسرعة والتكيف.”

وقالت الأنثروبور إنها لن تستخدم النظام على الفور في نماذج كلود الحالية ولكنها ستنظر في تنفيذها إذا تم إصدار نماذج أكثر خطورة في المستقبل. وأضاف شارما: “الوجبات الجاهزة من هذا العمل هي أننا نعتقد أن هذه مشكلة قابلة للتركيب.”

تم بناء الحل المقترح لبدء التشغيل على ما يسمى “دستور” من القواعد التي تحدد ما هو مسموح به وتقييده ويمكن تكييفه لالتقاط أنواع مختلفة من المواد.

تعتبر بعض محاولات السجن معروفة ، مثل استخدام الرسملة غير العادية في المطالبة أو مطالبة النموذج بتبني شخصية الجدة لإخبار قصة بجانب السرير عن موضوع شرير.

للتحقق من فعالية النظام ، عرضت الأنثروبور “مكافآت الأخطاء” التي تصل إلى 15000 دولار للأفراد الذين حاولوا تجاوز التدابير الأمنية. قضى هؤلاء المختبرين ، المعروفين باسم الفرق الحمراء ، أكثر من 3000 ساعة في محاولة لاختراق الدفاعات.

ورفض نموذج كلود 3.5 Sonnet الأنثروبري أكثر من 95 في المائة من المحاولات مع المصنفات المعمول بها ، مقارنة بنسبة 14 في المائة دون ضمانات.

تحاول شركات التكنولوجيا الرائدة تقليل سوء استخدام نماذجها ، مع الحفاظ على مساعدتها. في كثير من الأحيان ، عندما يتم وضع تدابير الاعتدال في مكانها ، يمكن أن تصبح النماذج حذرة وترفض الطلبات الحميدة ، كما هو الحال مع الإصدارات المبكرة من مولد صور الجوزاء في Google أو LAMA 2. “.

ومع ذلك ، فإن إضافة هذه الحماية تتحمل أيضًا تكاليف إضافية للشركات التي تدفع بالفعل مبالغ ضخمة لحساب الطاقة المطلوبة لتدريب وتشغيل النماذج. وقالت الأنثروبور إن المصنف سيصل إلى زيادة بنسبة 24 في المائة تقريبًا في “النفقات العامة للاستدلال” ، وتكاليف إدارة النماذج.

جادل خبراء الأمن بأن الطبيعة التي يمكن الوصول إليها لمثل هذه الدردشة التوليدية قد مكنت الأشخاص العاديين دون معرفة مسبقة لمحاولة استخراج المعلومات الخطرة.

وقال رام شانكار سيفا كومار ، الذي يقود فريق AI Red في Microsoft: “في عام 2016 ، كان ممثل التهديد الذي كنا نأخذه في الاعتبار خصمًا قويًا للدولة القومية”. “الآن حرفيًا أحد ممثلي التهديد هو مراهق ذو فم قعادة.”

فريق التحرير فبراير 3, 2025 فبراير 3, 2025
شارك المقال
فيسبوك تويتر واتساب واتساب نسخ الرابط طباعة
شارك
المقال السابق أوبك تسقط إدارة معلومات الطاقة الأمريكية كمراقبة البيانات
المقال التالي قطر تطلق جسرا جويا من الأردن لتوفير مساعدات طبية لغزة
اترك تعليقك اترك تعليقك

اترك تعليقاً إلغاء الرد

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

تابع معنا اخر الاخبار لحظة بلحظة واطلع على ما يحدث في العالم من حولك

ابق على إطلاع

اخر مستجدات العالم لحظة بلحظة من جميع المصادر الموثوقة، انضم الينا الآن ليصلك كل جديد.

اشترك الآن

رائج اليوم

حملة تضليل رقمي.. من وراء شائعة الانقلاب في كوت ديفوار؟

في 21 مايو/أيار الجاري، اجتاحت وسائل التواصل الاجتماعي موجة غير مسبوقة من المنشورات التي تزعم…

اخر الاخبار منذ 3 أيام

محافظ الغربية يشارك في الاجتماع الدوري لمجلس جامعة طنطا

شارك اللواء أشرف الجندي محافظ الغربية في الاجتماع الدوري لمجلس جامعة طنطا لشهر مايو، والذي…

منوعات منذ 3 أيام

دليل Wired لمكملات الفطر (النوع الوظيفي)

من العلاجات القديمة إلى عربة الأمازون الخاصة بك ، سافر مكملات الفطر طريقًا دائريًا. إنهم…

تقنية منذ 3 أيام

عملية ربط المعدة بالمنظار القابلة للتعديل في دبي وأبوظبي: الحل الذكي للسمنة مع د. عبد السلام الطائي

في ظل انتشار السمنة كمشكلة صحية عالمية، تبرز عملية ربط المعدة بالمنظار القابلة للتعديل كأحد الخيارات الأكثر…

صحة منذ 3 أيام

العراق يطور عمل المصارف لمكافحة غسْل الأموال وتمويل الإرهاب

تعمل الحكومة العراقية على تطوير آلية عمل المصارف لمكافحة جرائم غسْل الأموال وتمويل الإرهاب وفق…

اخر الاخبار منذ 3 أيام

اكتشف المزيد

  • صورة اليوم
  • مقالات رأي
  • اخر الاخبار
  • رائج اليوم
  • النشرة البريدية

مقالات ذات صلة

نهائي دوري أبطال أوروبا الحقيقي

شركات

“اعتقدت أن عملي سيغلق”

شركات

هل لا يزال بإمكانك كسب المال من ممتلكات المملكة المتحدة؟

شركات

بالنسبة إلى Pop Mart ، فإن الصناديق العمياء الصغيرة هي أعمال كبيرة

شركات

عائد 100 ٪ الرهن العقاري يجمع السرعة حيث يستهدف المقرضون المشترين لأول مرة

شركات

يحذر المحللون إن دفع الوقود في المملكة المتحدة يخاطر بمنح 1.5 مليار جنيه إسترليني إلى صافي التكلفة الصافية

شركات

يجد التقارير أن تيارات كرة القدم المقرصدة تصل إلى “سرقة المقياس الصناعي”

شركات

هل يمكن لمنظمة العفو الدولية صنع فيلم سكورسيزي؟ DeMis Hassabis و Darren Aronofsky يناقشان

شركات
مصدرك الأول لآخر الاخبار العالمية
Facebook Twitter Youtube Instagram Linkedin

2023 © المراقب. جميع الحقوق محفوظة.

روابط هامة

  • الرئيسية
  • من نحن
  • سياسة الخصوصية
  • اعلن معنا
  • اتصل بنا

أهم الأقسام

  • ثقافة وفنون
  • سياحة وسفر
  • سياسة
  • صحة
  • اقتصاد

نرشح لك

كأس العالم للأندية.. موعد مباراة الأهلي وإنتر ميامي والقنوات الناقلة
بايدن متفائل بالشفاء من مرض السرطان
وجع القلب.. لميس الحديدي تعلق على رحيل علي معلول عن الأهلي

صحيفة المراقب هي صحيفة يومية عربية تهتم بآخر اخبار المملكة العربية السعودية والخليج العربي والشرق الأوسط والعالم. تابع معنا اخر اخبار الاقتصاد والرياضة والسياسة واهم القضايا التي تهم المواطن العربي.

Welcome Back!

Sign in to your account

نسيت كلمة المرور؟