وبحسب خبراء التكنولوجيا المتحمسين للسوق والمتشككين المحترفين، فقد انفجرت فقاعة الذكاء الاصطناعي، وعاد الشتاء. لكن فاي فاي لي لا تصدق هذا. بل إن لي ــ التي اكتسبت لقب “عرابة الذكاء الاصطناعي” ــ تراهن على العكس من ذلك. وهي في إجازة بدوام جزئي من جامعة ستانفورد للمشاركة في تأسيس شركة تسمى وورلد لابس. وفي حين يعتمد الذكاء الاصطناعي التوليدي الحالي على اللغة، فإنها ترى حدودا حيث تبني الأنظمة عوالم كاملة بالفيزياء والمنطق والتفاصيل الغنية لواقعنا المادي. إنه هدف طموح، وعلى الرغم من النبلاء الكئيبين الذين يقولون إن التقدم في مجال الذكاء الاصطناعي وصل إلى هضبة قاتمة، فإن وورلد لابس تسير على المسار السريع للتمويل. وربما تكون الشركة الناشئة على بعد عام واحد من إنتاج منتج ــ وليس من الواضح على الإطلاق مدى نجاحه عندما يصل وإذا وصل ــ لكن المستثمرين قدموا 230 مليون دولار ويقال إنهم يقدرون الشركة الناشئة الناشئة بمليار دولار.
قبل عقد من الزمان تقريبًا، ساعدت لي الذكاء الاصطناعي في تغيير مساره من خلال إنشاء ImageNet، وهي قاعدة بيانات مخصصة للصور الرقمية التي سمحت للشبكات العصبية بأن تصبح أكثر ذكاءً بشكل كبير. وهي تشعر أن نماذج التعلم العميق اليوم تحتاج إلى دفعة مماثلة إذا كان الذكاء الاصطناعي سيخلق عوالم حقيقية، سواء كانت محاكاة واقعية أو أكوانًا متخيلة تمامًا. قد يؤلف جورج آر آر مارتينز المستقبلي عوالمه التي يحلم بها على شكل مطالبات بدلاً من النثر، والتي قد تقوم بعد ذلك برسمها والتجول فيها. تقول لي: “يُرى العالم المادي لأجهزة الكمبيوتر من خلال الكاميرات، ودماغ الكمبيوتر خلف الكاميرات. إن تحويل هذه الرؤية إلى تفكير وتوليد وتفاعل في نهاية المطاف يتضمن فهم البنية المادية والديناميكيات المادية للعالم المادي. وتسمى هذه التكنولوجيا الذكاء المكاني”. تطلق شركة World Labs على نفسها اسم شركة ذكاء مكاني، وسيساعد مصيرها في تحديد ما إذا كان هذا المصطلح سيصبح ثورة أم مجرد نكتة.
كانت لي مهووسة بالذكاء المكاني لسنوات. وبينما كان الجميع يجنون من برنامج ChatGPT، كانت هي وطالب سابق لها، جوستين جونسون، يتحدثان بحماس في مكالمات هاتفية حول الإصدار التالي من الذكاء الاصطناعي. يقول جونسون، الذي يعمل الآن أستاذًا مساعدًا في جامعة ميشيغان: “سيكون العقد القادم مخصصًا لتوليد محتوى جديد يأخذ الرؤية الحاسوبية والتعلم العميق والذكاء الاصطناعي من عالم الإنترنت، ويدمجها في المكان والزمان”.
قرر لي تأسيس شركة في أوائل عام 2023، بعد عشاء مع مارتن كاسادو، رائد في مجال الشبكات الافتراضية والذي أصبح الآن شريكًا في شركة أندريسن هورويتز. وهي شركة رأس المال الاستثماري الشهيرة بتبنيها شبه المسيحي للذكاء الاصطناعي. يرى كاسادو أن الذكاء الاصطناعي يسير على مسار مماثل لألعاب الكمبيوتر، التي بدأت بالنص، وانتقلت إلى الرسومات ثنائية الأبعاد، والآن لديها صور ثلاثية الأبعاد مبهرة. سيقود الذكاء المكاني التغيير. في النهاية، كما يقول، “يمكنك أن تأخذ كتابك المفضل، وتضعه في نموذج، ثم تخطو إليه حرفيًا وتشاهده يلعب في الوقت الفعلي، بطريقة غامرة”. واتفق كاسادو ولي على أن الخطوة الأولى لتحقيق ذلك هي الانتقال من نماذج اللغة الكبيرة إلى نماذج كبيرة. عالم نماذج.
بدأ لي في تجميع فريق، مع جونسون كمؤسس مشارك. اقترح كاسادو شخصين آخرين – أحدهما كريستوف لاسنر، الذي عمل في أمازون، ومختبرات ميتا رياليتي، وإبيك جيمز. وهو مخترع بولسار، وهو مخطط عرض أدى إلى تقنية شهيرة تسمى 3D Gaussian Splatting. يبدو هذا مثل فرقة مستقلة في حفل توغا في معهد ماساتشوستس للتكنولوجيا، لكنها في الواقع طريقة لتوليف المشاهد، على عكس الأشياء الفردية. كان اقتراح كاسادو الآخر هو بن ميلدنال، الذي ابتكر تقنية قوية تسمى NeRF – حقول الإشعاع العصبي – التي تحول صور البكسل ثنائية الأبعاد إلى رسومات ثلاثية الأبعاد. يقول: “لقد أخذنا أشياء من العالم الحقيقي إلى الواقع الافتراضي وجعلناها تبدو حقيقية تمامًا”. ترك منصبه كعالم أبحاث كبير في جوجل للانضمام إلى فريق لي.
من الواضح أن أحد الأهداف الواضحة لنموذج العالم الكبير هو غرس الإحساس بالعالم في الروبوتات. وهذا بالفعل من ضمن خطة مختبرات العالم، ولكن ليس في الوقت الحالي. المرحلة الأولى هي بناء نموذج يتمتع بفهم عميق للأبعاد الثلاثة، والطبيعة المادية، ومفاهيم المكان والزمان. بعد ذلك تأتي مرحلة حيث تدعم النماذج الواقع المعزز. بعد ذلك يمكن للشركة أن تتولى الروبوتات. إذا تحققت هذه الرؤية، فإن نماذج العالم الكبير سوف تعمل على تحسين السيارات ذاتية القيادة، والمصانع الآلية، وربما حتى الروبوتات الشبيهة بالبشر.