قامت DataBricks ، وهي شركة تساعد الشركات الكبرى على بناء نماذج ذكاء اصطناعي مخصص ، بتطوير خدعة تعلم آلية يمكن أن تعزز أداء نموذج الذكاء الاصطناعي دون الحاجة إلى بيانات نظيفة.
قضى جوناثان فرانكل ، كبير علوم الذكاء الاصطناعي في Databricks ، العام الماضي في التحدث مع العملاء حول التحديات الرئيسية التي يواجهونها في جعل الذكاء الاصطناعي يعمل بشكل موثوق.
المشكلة ، كما يقول فرانكل ، بيانات قذرة.
يقول فرانك: “كل شخص لديه بعض البيانات ، ولديه فكرة عما يريدون القيام به”. لكن الافتقار إلى البيانات النظيفة يجعل من الصعب ضبط نموذج لأداء مهمة محددة .. “لا أحد يظهر ببيانات لطيفة ونظيفة يمكنك التمسك بها في موجه أو (واجهة برمجة التطبيق) ،” لنموذج.
يمكن أن يسمح نموذج Databricks للشركات بنشر وكلاءها في النهاية بأداء المهام ، دون جودة البيانات في الطريق.
تقدم هذه التقنية نظرة نادرة على بعض الحيل الرئيسية التي يستخدمها المهندسون الآن لتحسين قدرات نماذج الذكاء الاصطناعى المتقدمة ، خاصة عندما يصعب الحصول على بيانات جيدة. تستفيد الطريقة من الأفكار التي ساعدت في إنتاج نماذج التفكير المتقدمة من خلال الجمع بين التعلم التعزيز ، أو وسيلة لنماذج الذكاء الاصطناعى لتحسين من خلال الممارسة ، مع بيانات التدريب “الاصطناعية” أو التي تنشئها الذكاء الاصطناعي.
تعتمد أحدث النماذج من Openai و Google و Deepseek اعتمادًا كبيرًا على التعلم التعزيز بالإضافة إلى بيانات التدريب الاصطناعية. كشفت Wired أن Nvidia تخطط لاكتساب Gretel ، وهي شركة متخصصة في البيانات الاصطناعية. يقول فرانكل: “نحن جميعًا ننقل هذا المساحة”.
تستغل طريقة Databricks حقيقة أنه ، بالنظر إلى محاولات كافية ، يمكن أن يسجل النموذج الضعيف جيدًا في مهمة أو معيار معين. يطلق الباحثون هذه الطريقة على تعزيز أداء النموذج “أفضل من N”. قامت Databricks بتدريب نموذج للتنبؤ بأفضل ما يفضله اختبار البشر ، بناءً على أمثلة. يمكن بعد ذلك استخدام نموذج مكافأة البيانات ، أو DBRM ، لتحسين أداء النماذج الأخرى دون الحاجة إلى مزيد من البيانات المسمى.
ثم يتم استخدام DBRM لتحديد أفضل المخرجات من نموذج معين. هذا يخلق بيانات تدريب اصطناعية لمزيد من صقل النموذج بحيث ينتج إخراجًا أفضل لأول مرة. تستدعي DataBricks التحسين التكيفي للوقت الجديد أو TAO. يقول فرانكل: “تستخدم هذه الطريقة التي نتحدث عنها عن بعض التعلم المعزز للوزن الخفيف نسبيًا أن يخبز بشكل أساسي فوائد أفضل N في النموذج نفسه”.
ويضيف أن الأبحاث التي أجراها DataBricks توضح أن طريقة TAO تتحسن حيث يتم توسيع نطاقها إلى نماذج أكبر وأكثر قدرة. يتم بالفعل استخدام التعلم التعزيز والبيانات الاصطناعية على نطاق واسع ، لكن الجمع بينها من أجل تحسين نماذج اللغة يعد تقنية جديدة نسبيًا وصعبة تقنيًا.
DataBricks مفتوحة بشكل غير عادي حول كيفية تطوير الذكاء الاصطناعي لأنها تريد إظهار العملاء أنه لديه المهارات اللازمة لإنشاء نماذج مخصصة قوية لهم. كشفت الشركة سابقًا عن كيفية تطوير DBX ، وهو نموذج لغة كبير مفتوح المصدر (LLM) من نقطة الصفر.