وباعتباري شخصًا يستمتع تمامًا بالترتيب، فقد كنت سعيدًا جدًا بإمساك مجرفة وفرشاة وكنس بعض حبوب البن المسكوبة على سطح الطاولة أثناء زيارتي لمختبر أبحاث تويوتا في كامبريدج، ماساتشوستس العام الماضي. كان العمل الرتيب أكثر صعوبة من المعتاد لأنه كان علي القيام بذلك باستخدام زوج من الأذرع الآلية التي يتم تشغيلها عن بعد مع كماشة ذات إصبعين لليدين.
عندما جلست أمام الطاولة، مستخدمًا زوجًا من وحدات التحكم مثل مقابض الدراجة ذات الأزرار والرافعات الإضافية، كان بإمكاني الشعور بإحساس الإمساك بالأشياء الصلبة، وكذلك الشعور بثقلها أثناء رفعها، لكن الأمر لا يزال يتطلب بعض الوقت للتعود عليه.
وبعد عدة دقائق من الترتيب، واصلت جولتي في المختبر ونسيت مهمتي القصيرة كمدرس للروبوتات. بعد بضعة أيام، أرسلت لي تويوتا مقطع فيديو للروبوت الذي قمت بتشغيله وهو يكتسح فوضى مماثلة بمفرده، باستخدام ما تعلمته من العروض التوضيحية التي قدمتها بالإضافة إلى عدد قليل من العروض التوضيحية وعدة ساعات أخرى من التدريب على الكنس داخل محاكاة عالم.
معظم الروبوتات – وخاصة تلك التي تقوم بأعمال قيمة في المستودعات أو المصانع – يمكنها فقط اتباع الإجراءات الروتينية المبرمجة مسبقًا والتي تتطلب خبرة فنية للتخطيط لها. وهذا يجعلها دقيقة للغاية وموثوقة ولكنها غير مناسبة تمامًا للتعامل مع العمل الذي يتطلب التكيف والارتجال والمرونة – مثل الكنس أو معظم الأعمال المنزلية الأخرى. لقد ثبت أن تعلم الروبوتات كيفية القيام بالأشياء بنفسها أمر صعب بسبب تعقيد وتنوع العالم المادي والبيئات البشرية، وصعوبة الحصول على بيانات تدريب كافية لتعليمها كيفية التعامل مع جميع الاحتمالات.
وهناك دلائل تشير إلى أن هذا قد يتغير. إن التحسينات الهائلة التي شهدناها في روبوتات الدردشة المدعمة بالذكاء الاصطناعي خلال العام الماضي أو نحو ذلك دفعت العديد من علماء الروبوتات إلى التساؤل عما إذا كان من الممكن تحقيق قفزات مماثلة في مجال تخصصهم. إن الخوارزميات التي منحتنا روبوتات الدردشة ومولدات الصور الرائعة تساعد بالفعل الروبوتات على التعلم بكفاءة أكبر.
يستخدم الروبوت الكنس الذي قمت بتدريبه نظامًا للتعلم الآلي يسمى سياسة الانتشار، على غرار تلك التي تشغل بعض مولدات صور الذكاء الاصطناعي، للتوصل إلى الإجراء الصحيح الذي يجب اتخاذه بعد ذلك في جزء من الثانية، استنادًا إلى الاحتمالات العديدة مصادر متعددة للبيانات. وقد طورت تويوتا هذه التقنية بالتعاون مع باحثين بقيادة شوران سونغ، الأستاذ في جامعة كولومبيا والذي يقود الآن مختبر الروبوتات في جامعة ستانفورد.
تحاول تويوتا الجمع بين هذا النهج ونوع نماذج اللغة التي تدعم ChatGPT ومنافسيها. الهدف هو تمكين الروبوتات من تعلم كيفية أداء المهام من خلال مشاهدة مقاطع الفيديو، مما قد يحول الموارد مثل YouTube إلى موارد تدريب قوية للروبوتات. ومن المفترض أن تُعرض عليهم مقاطع لأشخاص يقومون بأشياء معقولة، وليس الأعمال المثيرة المريبة أو الخطيرة التي غالباً ما توجد على وسائل التواصل الاجتماعي.
يقول روس تيدريك، نائب رئيس أبحاث الروبوتات في معهد أبحاث تويوتا والأستاذ في معهد ماساتشوستس للتكنولوجيا: “إذا لم يسبق لك أن لمست أي شيء في العالم الحقيقي، فمن الصعب الحصول على هذا الفهم من مجرد مشاهدة مقاطع الفيديو على موقع يوتيوب”. يقول تيدريك إن الأمل هو أن بعض الفهم الأساسي للعالم المادي بالإضافة إلى البيانات الناتجة عن المحاكاة، سيمكن الروبوتات من تعلم الحركات الجسدية من خلال مشاهدة مقاطع يوتيوب. ويقول إن نهج النشر “قادر على استيعاب البيانات بطريقة أكثر قابلية للتطوير”.