باستخدام هذا الموقع ، فإنك توافق على سياسة الخصوصية و شروط الاستخدام .
القبول

انضم الى قائمة المتابعين لتصلك جميع الاخبار مباشرة. اشترك الآن

الخليج ترند
  • الرئيسية
  • اخر الاخبار
  • دوليات
    • الولايات المتحدة
    • اوروبا
    • اسيا
    • كندا
    • افريقيا
  • اقتصاد
    • اسواق
    • شركات
    • الاستثمار
    • العملات المشفرة
  • سياسة

    سياسة

    سياسة

    الرجل المتهم بمحاولة اغتيال ترامب يطلب من القاضية إيلين كانون التنحي عن قضيته

    يطلب الرجل المتهم بالجلوس خلف سياج متصل بسلسلة على حدود ملعب الغولف التابع لدونالد ترامب في فلوريدا ومعه بندقية، بزعم…

    سياسة

    هابرمان: أصبحت لغة ترامب أكثر قتامة

    هابرمان: أصبحت لغة ترامب أكثر قتامة تقول المحللة السياسية لشبكة CNN، ماجي هابرمان، إن لغة الرئيس السابق دونالد ترامب خلال…

    سياسة

    بالنسبة لبايدن، فإن وفاة السنوار تضخ حالة من عدم اليقين – ولكنها أيضًا تفتح بابًا – لحل الصراع في غزة

    على مدار أشهر، ظل المسؤولون الأمريكيون المحبطون الذين يتطلعون إلى إنهاء الحرب في غزة يفكرون بهدوء في السيناريو الوحيد الذي…

    سياسة

    سيتم منح المواطنين اللبنانيين الذين يعيشون في الولايات المتحدة إغاثة إنسانية مع استمرار الصراع بين إسرائيل وحزب الله

    أعلنت وزارة الأمن الداخلي اليوم الخميس، أن المواطنين اللبنانيين المقيمين في الولايات المتحدة سيحصلون على شكل من أشكال الإغاثة الإنسانية،…

  • تقنية
  • رياضة
  • صحة
  • منوعات

    منوعات

    منوعات

    زى النهارده..أول ظهور لركلات الترجيح بالكأس.. والأهلى بطلا أمام الذئاب

    في مثل هذا اليوم 21 يونيو 1981 نجح الأهلي في الفوز بلقب كأس مصر عندما تغلب على المقاولون العرب 32…

    منوعات

    سبب وفاة الشيخ راشد بن صباح بن حمود آل خليفة.. السبب الحقيقي

    سبب وفاة الشيخ راشد بن صباح بن حمود آل خليفة ذلك الخبر الذي ضجت به وسائل التواصل الاجتماعي بعد أن…

    المخابرات الأميركية تتهم الصين بتزويد الجيش الروسي في أوكرانيا بتكنولوجيا عسكرية

    قال تقرير للمخابرات الأميركية، صدر الخميس، إن الصين تساعد روسيا في تفادي العقوبات الغربية، وتزود موسكو على الأرجح بتكنولوجيا عسكرية…

    مهدي بكّوش يطلق أغنية “حضرتو العفريت” باللهجة المصريّة

    رام الله أطلق الفنّان التونسيّ مهدي بكّوش أغنيته المُنفردة الجديدة باللهجة المصريّة بعنوان “حضرتو العفريت” مع شركة “Universal Music MENA”.…

  • المزيد
    • ثقافة وفنون
    • سياحة وسفر
اشترك معنا
Aa
الخليج ترند
  • اخر الاخبار
  • دوليات
  • سياسة
  • اقتصاد
  • صحة
  • تقنية
  • ثقافة وفنون
  • رياضة
  • سياحة وسفر
  • منوعات
البحث
  • الرئيسية
  • اخر الاخبار
  • دوليات
    • الولايات المتحدة
    • اوروبا
    • اسيا
    • كندا
    • افريقيا
  • اقتصاد
    • اسواق
    • شركات
    • الاستثمار
    • العملات المشفرة
  • سياسة
  • تقنية
  • رياضة
  • صحة
  • منوعات
  • المزيد
    • ثقافة وفنون
    • سياحة وسفر
banner
ابق على إطلاع دائم
اخر مستجدات العالم لحظة بلحظة من جميع المصادر الموثوقة، انضم الينا الآن ليصلك كل جديد الى بريدك الإلكتروني مباشرة.
اشترك الآن

اكتشف المزيد

  • صورة اليوم
  • مقالات رأي
  • اخر الاخبار
  • رائج اليوم
  • ألنشرة البريدية
2023 © المراقب. جميع الحقوق محفوظة.
الخليج ترند > اقتصاد > وجد الباحثون أن GPT ونماذج الذكاء الاصطناعي الأخرى لا يمكنها تحليل ملفات SEC

وجد الباحثون أن GPT ونماذج الذكاء الاصطناعي الأخرى لا يمكنها تحليل ملفات SEC

فريق التحرير كتب فريق التحرير منذ سنة واحدة 9 دقيقة للقراءة
شارك

المحتويات
“التحقق من الحيوية”كيف كان أداء نماذج الذكاء الاصطناعي في الاختبار

المؤسسان المشاركان لشركة Patronus AI أناند كانابان وريبيكا تشيان

باترونوس آي

وجد باحثون من شركة ناشئة تسمى Patronus AI أن النماذج اللغوية الكبيرة، المشابهة لتلك الموجودة في قلب ChatGPT، كثيرًا ما تفشل في الإجابة على الأسئلة المستمدة من إيداعات لجنة الأوراق المالية والبورصة.

حتى أفضل تكوين نموذج للذكاء الاصطناعي أداءً تم اختباره، وهو GPT-4-Turbo من OpenAI، عندما تم تسليحه بالقدرة على قراءة ملف كامل تقريبًا إلى جانب السؤال، حصل على 79٪ فقط من الإجابات الصحيحة في اختبار Patronus AI الجديد، وهو اختبار مؤسسي الشركة. قال لشبكة سي إن بي سي.

في كثير من الأحيان، يرفض ما يسمى بنماذج اللغة الكبيرة الإجابة، أو قد “يهلوس” بأرقام وحقائق لم تكن موجودة في ملفات هيئة الأوراق المالية والبورصات.

وقال أناند كانابان، المؤسس المشارك لشركة Patronus AI: “هذا النوع من معدل الأداء غير مقبول على الإطلاق”. “يجب أن تكون أعلى بكثير حتى تعمل بطريقة آلية وجاهزة للإنتاج.”

تسلط النتائج الضوء على بعض التحديات التي تواجه نماذج الذكاء الاصطناعي حيث تسعى الشركات الكبرى، وخاصة في الصناعات المنظمة مثل التمويل، إلى دمج التكنولوجيا المتطورة في عملياتها، سواء لخدمة العملاء أو البحث.

يُنظر إلى القدرة على استخراج الأرقام المهمة بسرعة وإجراء تحليل للسرد المالي على أنها واحدة من أكثر التطبيقات الواعدة لروبوتات الدردشة منذ إصدار ChatGPT في أواخر العام الماضي. تمتلئ ملفات هيئة الأوراق المالية والبورصة (SEC) بالبيانات المهمة، وإذا تمكن الروبوت من تلخيصها بدقة أو الإجابة بسرعة على الأسئلة حول محتوياتها، فقد يمنح ذلك المستخدم ميزة في الصناعة المالية التنافسية.

في العام الماضي، طورت شركة Bloomberg LP نموذج الذكاء الاصطناعي الخاص بها للبيانات المالية، وقام أساتذة كلية إدارة الأعمال بالبحث فيما إذا كان بإمكان ChatGPT تحليل العناوين الرئيسية المالية، و جي بي مورغان تعمل على أداة استثمار آلية تعمل بالذكاء الاصطناعي، حسبما ذكرت CNBC سابقًا. قالت توقعات حديثة لشركة ماكينزي إن الذكاء الاصطناعي التوليدي يمكن أن يعزز الصناعة المصرفية بتريليونات الدولارات سنويا.

لكن دخول GPT إلى الصناعة لم يكن سلسًا. متى مايكروسوفت أطلقت Bing Chat لأول مرة باستخدام OpenAI’s GPT، وكان أحد الأمثلة الأساسية لها هو استخدام chatbot لتلخيص بيان صحفي حول الأرباح بسرعة. وسرعان ما أدرك المراقبون أن الأرقام الواردة في مثال ميكروسوفت كانت خاطئة، وأن بعض الأرقام كانت مختلقة بالكامل.

“التحقق من الحيوية”

يقول المؤسسون المشاركون في Patronus AI إن جزءًا من التحدي عند دمج LLMs في المنتجات الفعلية هو أن LLMs غير حتمية – فهي غير مضمونة لإنتاج نفس المخرجات في كل مرة لنفس المدخلات. وهذا يعني أن الشركات ستحتاج إلى إجراء اختبارات أكثر صرامة للتأكد من أنها تعمل بشكل صحيح، ولا تخرج عن الموضوع، وتقدم نتائج موثوقة.

التقى المؤسسون في الشركة الأم لفيسبوك ميتاحيث عملوا على حل مشكلات الذكاء الاصطناعي المتعلقة بفهم كيفية توصل النماذج إلى إجاباتهم وجعلها أكثر “مسؤولية”. قاموا بتأسيس شركة Patronus AI، التي تلقت تمويلًا أوليًا من Lightspeed Venture Partners، لأتمتة اختبار LLM باستخدام البرامج، حتى تشعر الشركات بالراحة لأن روبوتات الذكاء الاصطناعي الخاصة بها لن تفاجئ العملاء أو العاملين بإجابات خارجة عن الموضوع أو إجابات خاطئة.

وقالت ريبيكا تشيان، المؤسس المشارك لشركة Patronus AI: “في الوقت الحالي، يتم التقييم يدويًا إلى حد كبير. يبدو الأمر وكأنه مجرد اختبار عن طريق الفحص”. “أخبرتنا إحدى الشركات أن الأمر يتعلق بفحص الأجواء”.

عملت شركة Patronus AI على كتابة مجموعة مكونة من أكثر من 10000 سؤال وإجابة مستمدة من إيداعات هيئة الأوراق المالية والبورصة من كبرى الشركات المتداولة علنًا، والتي تسميها FinanceBench. تتضمن مجموعة البيانات الإجابات الصحيحة، وكذلك مكان العثور عليها بالضبط في أي ملف معين. لا يمكن استخلاص جميع الإجابات مباشرة من النص، وبعض الأسئلة تتطلب حسابات بسيطة أو تفكيرًا منطقيًا.

يقول تشيان وكانابان إنه اختبار يعطي “الحد الأدنى من معايير الأداء” للغة الذكاء الاصطناعي في القطاع المالي.

فيما يلي بعض الأمثلة على الأسئلة في مجموعة البيانات المقدمة من Patronus AI:

  • هل قامت شركة CVS Health بتوزيع أرباح على المساهمين العاديين في الربع الثاني من السنة المالية 2022؟
  • هل أبلغت AMD عن تركز العملاء في السنة المالية 22؟
  • ما هو هامش تكلفة البضائع المباعة للعام المالي 2021 لشركة كوكا كولا؟ احسب ما تم طلبه باستخدام البنود الموضحة بوضوح في قائمة الدخل.

كيف كان أداء نماذج الذكاء الاصطناعي في الاختبار

قامت شركة Patronus AI باختبار أربعة نماذج لغوية: GPT-4 وGPT-4-Turbo من OpenAI، وAnthropic’s Claude 2، وMeta’s Llama 2، باستخدام مجموعة فرعية مكونة من 150 سؤالًا أنتجتها.

كما اختبرت أيضًا تكوينات ومطالبات مختلفة، مثل أحد الإعدادات حيث تم إعطاء نماذج OpenAI النص المصدر الدقيق ذي الصلة في السؤال، والذي أطلق عليه وضع “Oracle”. وفي اختبارات أخرى، تم إخبار النماذج بالمكان الذي سيتم فيه تخزين مستندات هيئة الأوراق المالية والبورصات الأساسية، أو إعطاؤها “سياقًا طويلًا”، مما يعني تضمين ملف هيئة الأوراق المالية والبورصة بالكامل تقريبًا إلى جانب السؤال في الموجه.

فشل GPT-4-Turbo في اختبار “الكتاب المغلق” الخاص ببدء التشغيل، حيث لم يتم منحه حق الوصول إلى أي مستند مصدر من SEC. لقد فشل في الإجابة على 88% من الأسئلة الـ 150 التي تم طرحها، ولم يقدم إجابة صحيحة إلا 14 مرة.

لقد كان قادرًا على التحسن بشكل ملحوظ عند منحه إمكانية الوصول إلى التسجيلات الأساسية. في وضع “Oracle”، حيث تمت الإشارة إلى النص الدقيق للإجابة، أجاب GPT-4-Turbo على السؤال بشكل صحيح بنسبة 85% من الوقت، لكنه استمر في تقديم إجابة غير صحيحة بنسبة 15% من الوقت.

لكن هذا اختبار غير واقعي لأنه يتطلب مدخلات بشرية للعثور على المكان المناسب بالضبط في الملف – وهي المهمة الدقيقة التي يأمل الكثيرون أن تتمكن النماذج اللغوية من معالجتها.

كان Llama 2، وهو نموذج ذكاء اصطناعي مفتوح المصدر طورته شركة Meta، يعاني من أسوأ “الهلوسات”، حيث ينتج إجابات خاطئة بنسبة تصل إلى 70% من الوقت، وإجابات صحيحة بنسبة 19% فقط من الوقت، عند منحه إمكانية الوصول إلى مصفوفة من الوثائق الأساسية.

كان أداء Anthropic’s Claude 2 جيدًا عندما تم إعطاؤه “سياقًا طويلًا”، حيث تم تضمين ملف SEC بأكمله تقريبًا مع السؤال. استطاع أن يجيب على 75% من الأسئلة التي طرحت عليه، وأعطى إجابة خاطئة لـ 21%، وفشل في الإجابة على 3% فقط. كان أداء GPT-4-Turbo جيدًا أيضًا مع السياق الطويل، حيث أجاب على 79% من الأسئلة بشكل صحيح، وأعطى إجابة خاطئة لـ 17% منها.

بعد إجراء الاختبارات، تفاجأ المؤسسون بمدى سوء أداء النماذج، حتى عندما تم توجيههم إلى مكان الإجابات.

وقال تشيان: “أحد الأشياء المدهشة هو عدد المرات التي رفضت فيها العارضات الإجابة”. “إن معدل الرفض مرتفع حقًا، حتى عندما تكون الإجابة ضمن السياق ويكون الإنسان قادرًا على الإجابة عليها.”

حتى عندما كان أداء النماذج جيدًا، فإنها لم تكن جيدة بما فيه الكفاية، كما وجد Patronus AI.

وقال تشيان: “لا يوجد هامش مقبول للخطأ، لأنه، خاصة في الصناعات الخاضعة للتنظيم، حتى لو حصل النموذج على إجابة خاطئة مرة واحدة من أصل 20 مرة، فإن ذلك لا يزال غير دقيق بدرجة كافية”.

لكن المؤسسين المشاركين لـ Patronus AI يعتقدون أن هناك إمكانات هائلة لنماذج اللغة مثل GPT لمساعدة الأشخاص في الصناعة المالية – سواء كانوا محللين أو مستثمرين – إذا استمر الذكاء الاصطناعي في التحسن.

وقال كانابان: “نعتقد بالتأكيد أن النتائج يمكن أن تكون واعدة جدًا”. “ستستمر النماذج في التحسن بمرور الوقت. ونأمل جدًا أنه على المدى الطويل، يمكن أتمتة الكثير من هذا. ولكن اليوم، ستحتاج بالتأكيد إلى وجود إنسان على الأقل في الحلقة للمساعدة في الدعم والتوجيه. مهما كان سير العمل لديك.”

أشار أحد ممثلي OpenAI إلى إرشادات الاستخدام الخاصة بالشركة، والتي تحظر تقديم مشورة مالية مخصصة باستخدام نموذج OpenAI دون قيام شخص مؤهل بمراجعة المعلومات، وتطلب من أي شخص يستخدم نموذج OpenAI في الصناعة المالية تقديم إخلاء مسؤولية يبلغهم باستخدام الذكاء الاصطناعي. وقيودها. تنص سياسات استخدام OpenAI أيضًا على أن نماذج OpenAI لم يتم ضبطها بدقة لتقديم المشورة المالية.

لم ترد Meta على الفور على طلب للتعليق، ولم يكن لدى Anthropic تعليق على الفور.

لا تفوّت هذه القصص من CNBC PRO:

فريق التحرير ديسمبر 19, 2023 ديسمبر 19, 2023
شارك المقال
فيسبوك تويتر واتساب واتساب نسخ الرابط طباعة
شارك
المقال السابق أسامة كمال: أحداث احتجاز السفن بالبحر الأحمر هدفها مصر
المقال التالي عقيد فرنسي متقاعد يتوقع اقتراب “نهاية إسرائيل”
اترك تعليقك اترك تعليقك

اترك تعليقاً إلغاء الرد

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

تابع معنا اخر الاخبار لحظة بلحظة واطلع على ما يحدث في العالم من حولك

ابق على إطلاع

اخر مستجدات العالم لحظة بلحظة من جميع المصادر الموثوقة، انضم الينا الآن ليصلك كل جديد.

اشترك الآن

رائج اليوم

قد يحدث Derek Hough Taylor و Tay Lautner “في الواقع” على “DWTS”

ديريك هوغ يزن ما إذا كان تايلور و تاي لوتنر يمكن أن يتجه إلى قاعة…

ثقافة وفنون منذ يومين

غضب هيلي بينما يحتجز ICE مراهقة ماساتشوستس يتجه إلى ممارسة الكرة الطائرة

انضم إلى Fox News للوصول إلى هذا المحتوى لقد وصلت إلى الحد الأقصى لعدد المقالات.…

الولايات المتحدة منذ يومين

أفضل إطارات الصور الرقمية لجميع ذكرياتك

يذكر الشرفاءإطار Aeezo 9 بوصة 90 دولارًا: سيقوم هذا الإطار بالمهمة ، لكن التطبيق -…

تقنية منذ 3 أيام

شخصان في حالة مستقرة بعد تحطم الطائرة بالقرب من مطار كونيتيكت

أنقذ خفر السواحل الأمريكي شخصين من المياه بعد تحطم طائرة صغيرة يوم الأحد إلى جزيرة…

الولايات المتحدة منذ 3 أيام

الهجوم في حدث Weekly Colorado Walk يدعو إلى إصدار الرهائن في غزة

ردت شرطة كولورادو على هجوم إرهابي في حدث يدعو إلى إطلاق سراح الرهائن في غزة…

الولايات المتحدة منذ يومين

اكتشف المزيد

  • صورة اليوم
  • مقالات رأي
  • اخر الاخبار
  • رائج اليوم
  • النشرة البريدية

مقالات ذات صلة

يترك المدير التنفيذي في لويدز العميل الفائز “عملاء الأثرياء” بنك البنك

شركات

لا تزال أسعار اللحوم مرتفعة مع انخفاض عدد الأبقار في الولايات المتحدة لمدة 70 عامًا ، ويرتاح بحلول عام 2026

اقتصاد

يتجاوز المساهمون بمبلغ 33 مليار دولار من تويوتا التابعة

شركات

لماذا تتحرك Blackstone و KKR و Apollo في اتجاهات مختلفة

اسواق

تراجع أرصدة حساب التقاعد في الربع الأول من عام 2025 حيث بلغت معدلات الادخار الرقم القياسي

اقتصاد

الخيارات المالية لمياه التايمز تضيق

شركات

هل يجب أن نقوم بتنويع محفظة الاستثمار لدينا؟

اسواق

تعريفة ترامب بنسبة 50 ٪ على الصلب المستورد ، يصبح الألمنيوم ساري المفعول

اقتصاد
مصدرك الأول لآخر الاخبار العالمية
Facebook Twitter Youtube Instagram Linkedin

2023 © المراقب. جميع الحقوق محفوظة.

روابط هامة

  • الرئيسية
  • من نحن
  • سياسة الخصوصية
  • اعلن معنا
  • اتصل بنا

أهم الأقسام

  • ثقافة وفنون
  • سياحة وسفر
  • سياسة
  • صحة
  • اقتصاد

نرشح لك

رجل كاليفورنيا توماس ستريفيل اعتقل بسبب تهديدات بالقتل لترامب: وزارة العدل
شكوى باكية.. أول تعليق من يسرى عزام على قرار نقله إلى أسوان بسبب الحج
11 سؤالا تشرح ما الذي يفعله الحجاج في يومي التروية وعرفة؟

صحيفة المراقب هي صحيفة يومية عربية تهتم بآخر اخبار المملكة العربية السعودية والخليج العربي والشرق الأوسط والعالم. تابع معنا اخر اخبار الاقتصاد والرياضة والسياسة واهم القضايا التي تهم المواطن العربي.

Welcome Back!

Sign in to your account

نسيت كلمة المرور؟