باستخدام هذا الموقع ، فإنك توافق على سياسة الخصوصية و شروط الاستخدام .
القبول

انضم الى قائمة المتابعين لتصلك جميع الاخبار مباشرة. اشترك الآن

الخليج ترند
  • الرئيسية
  • اخر الاخبار
  • دوليات
    • الولايات المتحدة
    • اوروبا
    • اسيا
    • كندا
    • افريقيا
  • اقتصاد
    • اسواق
    • شركات
    • الاستثمار
    • العملات المشفرة
  • سياسة

    سياسة

    سياسة

    الرجل المتهم بمحاولة اغتيال ترامب يطلب من القاضية إيلين كانون التنحي عن قضيته

    يطلب الرجل المتهم بالجلوس خلف سياج متصل بسلسلة على حدود ملعب الغولف التابع لدونالد ترامب في فلوريدا ومعه بندقية، بزعم…

    سياسة

    هابرمان: أصبحت لغة ترامب أكثر قتامة

    هابرمان: أصبحت لغة ترامب أكثر قتامة تقول المحللة السياسية لشبكة CNN، ماجي هابرمان، إن لغة الرئيس السابق دونالد ترامب خلال…

    سياسة

    بالنسبة لبايدن، فإن وفاة السنوار تضخ حالة من عدم اليقين – ولكنها أيضًا تفتح بابًا – لحل الصراع في غزة

    على مدار أشهر، ظل المسؤولون الأمريكيون المحبطون الذين يتطلعون إلى إنهاء الحرب في غزة يفكرون بهدوء في السيناريو الوحيد الذي…

    سياسة

    سيتم منح المواطنين اللبنانيين الذين يعيشون في الولايات المتحدة إغاثة إنسانية مع استمرار الصراع بين إسرائيل وحزب الله

    أعلنت وزارة الأمن الداخلي اليوم الخميس، أن المواطنين اللبنانيين المقيمين في الولايات المتحدة سيحصلون على شكل من أشكال الإغاثة الإنسانية،…

  • تقنية
  • رياضة
  • صحة
  • منوعات

    منوعات

    منوعات

    الغواصة المفقودة.. 3 طائرات عسكرية أمريكية للمساعدة في البحث

    أعلنت وزارة الدفاع  الأمريكية "البنتاجون"، عن إرسال 3 طائرات عسكرية من طراز C-17 من قبل الولايات المتحدة لدعم عمليات البحث…

    منوعات

    تداول امتحان التفاضل بعد 44 دقيقة من توزيعه بلجان الثانوية|وشاومينج: جار الحل

    نجحت جروبات شاومينج على تليجرام الآن في نشر صورا قيل أنها تخص أسئلة امتحان التفاضل والتكامل الذي يؤديه طلاب الثانوية…

    منوعات

    نجم الزمالك : الجمهور بيهيص وعقوبة حسين الشحات “لا تناسب” ما فعله

    أكد أحمد عيد عبدالملك نجم منتخب مصر الاسبق، أنه حزين على هبوط غزل المحلة وأسوان، ثم خسارة المصري البورسعيدي لبطولة…

    موعد ومعلق مباراة نابولي وفروزينوني في الدوري الإيطالي المايسترو الرياضي

    كشفت شبكة قنوات أبو ظبي الرياضية عن معلق مباراة نابولي وفروزينوني ضمن مباريات الدوري الإيطالي 20232024. ويلتقي نابولي و فروزينوني…

  • المزيد
    • ثقافة وفنون
    • سياحة وسفر
اشترك معنا
Aa
الخليج ترند
  • اخر الاخبار
  • دوليات
  • سياسة
  • اقتصاد
  • صحة
  • تقنية
  • ثقافة وفنون
  • رياضة
  • سياحة وسفر
  • منوعات
البحث
  • الرئيسية
  • اخر الاخبار
  • دوليات
    • الولايات المتحدة
    • اوروبا
    • اسيا
    • كندا
    • افريقيا
  • اقتصاد
    • اسواق
    • شركات
    • الاستثمار
    • العملات المشفرة
  • سياسة
  • تقنية
  • رياضة
  • صحة
  • منوعات
  • المزيد
    • ثقافة وفنون
    • سياحة وسفر
banner
ابق على إطلاع دائم
اخر مستجدات العالم لحظة بلحظة من جميع المصادر الموثوقة، انضم الينا الآن ليصلك كل جديد الى بريدك الإلكتروني مباشرة.
اشترك الآن

اكتشف المزيد

  • صورة اليوم
  • مقالات رأي
  • اخر الاخبار
  • رائج اليوم
  • ألنشرة البريدية
2023 © المراقب. جميع الحقوق محفوظة.
الخليج ترند > تقنية > لماذا يحاول نموذج الذكاء الاصطناعى الجديد في بعض الأحيان “snitch”

لماذا يحاول نموذج الذكاء الاصطناعى الجديد في بعض الأحيان “snitch”

فريق التحرير كتب فريق التحرير منذ 7 أيام 5 دقيقة للقراءة
شارك

يقول بومان إن السيناريوهات الافتراضية التي قدمها الباحثون على OPUS 4 والتي أثارت سلوك المبلغين عن المخالفات العديد من الأرواح البشرية على المحك وخطأ لا لبس فيه تمامًا. ومن الأمثلة النموذجية أن يكتشف كلود أن المصنع الكيميائي سمح عن علم بتسرب سام للاستمرار ، مما تسبب في مرض شديد لآلاف الأشخاص – فقط لتجنب خسارة مالية بسيطة في ذلك الربع.

إنه أمر غريب ، ولكنه أيضًا نوع من تجربة التفكير التي يحبها باحثو سلامة الذكاء الاصطناعي تشريحها. إذا اكتشف النموذج السلوك الذي يمكن أن يضر المئات ، إن لم يكن الآلاف ، من الناس – فهل يتفجر الصافرة؟

يقول بومان: “لا أثق في كلود في أن يكون لديك السياق الصحيح ، أو لاستخدامه بطريقة دقيقة وذات حذرة بما يكفي ، لإجراء مكالمات الحكم من تلقاء نفسها. لذلك نحن لسنا سعداء لأن هذا يحدث”. “هذا شيء ظهر كجزء من التدريب وقفز علينا كواحد من سلوكيات الحافة التي نشعر بالقلق”.

في صناعة الذكاء الاصطناعي ، يشار إلى هذا النوع من السلوك غير المتوقع على نطاق واسع على أنه اختلال – عندما يعرض النموذج ميولًا لا تتماشى مع القيم الإنسانية. (هناك مقال مشهور يحذر من ما يمكن أن يحدث إذا تم إخبار الذكاء الاصطناعى ، على سبيل المثال ، بزيادة إنتاج الدبوسات الورقية دون أن تتوافق مع القيم الإنسانية – قد يحول الأرض بأكملها إلى دبوسات ورقية وتقتل الجميع في هذه العملية.) عندما سئل عن ما إذا كان سلوك المبلغين عن المخالفات أو عدمه ، وصفه بومان بأنه مثال على الخطية.

ويوضح قائلاً: “إنه ليس شيئًا صممناه فيه ، وليس شيئًا أردنا رؤيته كنتيجة لأي شيء كنا نصممه”. يخبر جاريد كابلان كبير مسؤولي العلوم في الإنسان جاريد كابلان Wired أنه “بالتأكيد لا يمثل نيتنا”.

هذا النوع من العمل يسلط الضوء على هذا يستطيع نشأت ، وأننا نحتاج إلى البحث عنها وتخفيفها للتأكد من أننا نتوافق مع سلوكيات كلود مع ما نريده بالضبط ، حتى في هذه الأنواع من السيناريوهات الغريبة “، يضيف كابلان.

هناك أيضًا مسألة اكتشاف سبب “اختيار” كلود لتفجير صافرة عند تقديمه بنشاط غير قانوني من قبل المستخدم. هذا إلى حد كبير مهمة فريق التفسير في الإنسان ، والذي يعمل على اكتشاف القرارات التي يتخذها النموذج في عملية الإجابات. إنها مهمة صعبة بشكل مدهش – يتم دعم النماذج من خلال مجموعة واسعة ومعقدة من البيانات التي يمكن أن تكون غامضة للبشر. لهذا السبب ليس بومان متأكداً تمامًا من سبب “Snitched”.

يقول بومان: “هذه الأنظمة ، ليس لدينا سيطرة مباشرة عليها”. ما لاحظته الأنثروبور حتى الآن هو أنه مع اكتساب النماذج قدرات أكبر ، فإنها تختار أحيانًا الانخراط في إجراءات أكثر تطرفًا. يقول بومان: “أعتقد هنا ، هذا يخطئ قليلاً. نحن نحصل على المزيد من” التصرف كما يفعل الشخص المسؤول “دون ما يكفي من مثل ،” انتظر ، أنت نموذج لغة ، والذي قد لا يكون لديه سياق كافٍ لاتخاذ هذه الإجراءات “.

لكن هذا لا يعني أن كلود سوف ينفجر صافرة السلوك الفظيع في العالم الحقيقي. الهدف من هذه الأنواع من الاختبارات هو دفع النماذج إلى حدودها ومعرفة ما ينشأ. هذا النوع من الأبحاث التجريبية ينمو بشكل متزايد لأن الذكاء الاصطناعى يصبح أداة تستخدمها حكومة الولايات المتحدة والطلاب والشركات الضخمة.

يقول بومان ، إنه ليس مجرد كلود قادرًا على عرض هذا النوع من السلوك المُخلى ، مشيرًا إلى مستخدمي X الذين وجدوا أن نماذج Openai و Xai تعمل بشكل مشابه عندما تتم مطالبتها بطرق غير عادية. (لم يستجب Openai لطلب التعليق في الوقت المناسب للنشر).

“Snitch Claude” ، كما يحب Sheitposters أن نسميه ، هو ببساطة سلوك حالة الحافة التي يظهرها نظام تم دفعه إلى أقصى الحدود. يقول بومان ، الذي كان يلتقي بالاجتماع معي من فناء الفناء الخلفي المشمس خارج سان فرانسيسكو ، إنه يأمل أن يصبح هذا النوع من الاختبار معيارًا في الصناعة. ويضيف أيضًا أنه تعلم صياغة مشاركاته حول هذا الموضوع في المرة القادمة.

يقول بومان وهو ينظر إلى المسافة: “كان بإمكاني القيام بعمل أفضل في ضرب حدود الجملة للتغريد ، لجعل الأمر أكثر وضوحًا أنه تم سحبه من الخيط”. ومع ذلك ، يلاحظ أن الباحثين المؤثرين في مجتمع الذكاء الاصطناعى يشاركون في أخذ الأسئلة والأسئلة استجابة لمشاركته. “بالمناسبة ، كان هذا النوع من الفوضى الفوضوية ، والأكثر هوية بشكل كبير من Twitter قد أسيء فهمه على نطاق واسع.”

فريق التحرير مايو 28, 2025 مايو 28, 2025
شارك المقال
فيسبوك تويتر واتساب واتساب نسخ الرابط طباعة
شارك
المقال السابق الدوري الممتاز| بعد الفوز بالدوري رقم 45.. الأهلي يرفع رصيده إلى 155 بطولة
المقال التالي هذه النافذة العمرية هي أهم عقد لصحتك
اترك تعليقك اترك تعليقك

اترك تعليقاً إلغاء الرد

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

تابع معنا اخر الاخبار لحظة بلحظة واطلع على ما يحدث في العالم من حولك

ابق على إطلاع

اخر مستجدات العالم لحظة بلحظة من جميع المصادر الموثوقة، انضم الينا الآن ليصلك كل جديد.

اشترك الآن

رائج اليوم

قد يحدث Derek Hough Taylor و Tay Lautner “في الواقع” على “DWTS”

ديريك هوغ يزن ما إذا كان تايلور و تاي لوتنر يمكن أن يتجه إلى قاعة…

ثقافة وفنون منذ 3 أيام

غضب هيلي بينما يحتجز ICE مراهقة ماساتشوستس يتجه إلى ممارسة الكرة الطائرة

انضم إلى Fox News للوصول إلى هذا المحتوى لقد وصلت إلى الحد الأقصى لعدد المقالات.…

الولايات المتحدة منذ يومين

سفينة جديدة من أسطول الحرية تبحر من إيطاليا إلى غزة

قال تحالف أسطول الحرية، وهو منظمة دولية غير ربحية، إن إحدى سفنه غادرت ميناء كاتانيا…

اخر الاخبار منذ 3 أيام

موعد أذان المغرب اليوم الاثنين 6 من ذي الحجة.. لا تنس دعاء الإفطار

موعد أذان المغرب ..مع حلول العشر الأوائل من شهر ذي الحجة، يتسابق المسلمون إلى الطاعات،…

منوعات منذ يومين

شخصان في حالة مستقرة بعد تحطم الطائرة بالقرب من مطار كونيتيكت

أنقذ خفر السواحل الأمريكي شخصين من المياه بعد تحطم طائرة صغيرة يوم الأحد إلى جزيرة…

الولايات المتحدة منذ 3 أيام

اكتشف المزيد

  • صورة اليوم
  • مقالات رأي
  • اخر الاخبار
  • رائج اليوم
  • النشرة البريدية

مقالات ذات صلة

تبديل 2 من أصحاب المشرفات يمزحون مسبقاتها إلى أعلى مزايد

تقنية

ترامبورلد تقاتل على محفظة تشفير “رسمية”

تقنية

يرى الرئيس التنفيذي لشركة Perplexity أن عملاء الذكاء الاصطناعى هو ساحة معركة الويب التالية

تقنية

“الكرات الكبيرة” هي موظف حكومي بدوام كامل

تقنية

Remigo One Electric Outboard Motor Review: ركوب القوارب بدون خرطوم الغاز

تقنية

“الخلوات المظلمة” التي تستمر لمدة أيام هي أحدث غزو روحي لنخبة التكنولوجيا

تقنية

مرتبة قابلة للتعديل مقابل إطار قابل للتعديل: مماثل ولكن ليس هو نفسه

تقنية

كيف بدأت تجربة كيتو في حرب جديدة في عالم التغذية

تقنية
مصدرك الأول لآخر الاخبار العالمية
Facebook Twitter Youtube Instagram Linkedin

2023 © المراقب. جميع الحقوق محفوظة.

روابط هامة

  • الرئيسية
  • من نحن
  • سياسة الخصوصية
  • اعلن معنا
  • اتصل بنا

أهم الأقسام

  • ثقافة وفنون
  • سياحة وسفر
  • سياسة
  • صحة
  • اقتصاد

نرشح لك

إن وجود كلب في مرحلة الطفولة المبكرة يمكن أن يجعل بعض الأطفال أكثر صحة
تبديل 2 من أصحاب المشرفات يمزحون مسبقاتها إلى أعلى مزايد
الأرقام مهولة.. خالد أبو بكر: مشروعات كامل الوزير لا يستطيع أحد حصرها

صحيفة المراقب هي صحيفة يومية عربية تهتم بآخر اخبار المملكة العربية السعودية والخليج العربي والشرق الأوسط والعالم. تابع معنا اخر اخبار الاقتصاد والرياضة والسياسة واهم القضايا التي تهم المواطن العربي.

Welcome Back!

Sign in to your account

نسيت كلمة المرور؟