قام إيلي كولينز، نائب رئيس إدارة المنتجات في Google DeepMind، بعرض أدوات الفيديو التوليدية للذكاء الاصطناعي لأول مرة أمام مجلس إدارة الشركة في عام 2022. وعلى الرغم من سرعة النموذج البطيئة، وتكلفة تشغيله الباهظة، ومخرجاته غير المتوازنة في بعض الأحيان، إلا أنه يقول إنها كانت لحظة فتحت أعينهم لرؤية مقاطع فيديو جديدة تم إنشاؤها من موجه عشوائي.
والآن، بعد بضع سنوات فقط، أعلنت جوجل عن خططها لأداة داخل تطبيق يوتيوب تسمح لأي شخص بإنشاء مقاطع فيديو بالذكاء الاصطناعي، باستخدام نموذج Veo الخاص بالشركة، ونشرها مباشرة كجزء من YouTube Shorts. وتقول سارة علي، مديرة إدارة المنتجات في يوتيوب: “بالنظر إلى عام 2025، سنسمح للمستخدمين بإنشاء مقاطع فيديو ومقاطع قصيرة مستقلة. سيكونون قادرين على إنشاء مقاطع فيديو مدتها ست ثوانٍ من مطالبة نصية مفتوحة”. وتقول علي إن التحديث يمكن أن يساعد المبدعين الذين يبحثون عن لقطات لملء مقطع فيديو أو يحاولون تصور شيء خيالي. وهي مصرة على أن أداة Veo AI ليست مخصصة لاستبدال الإبداع، بل تعزيزه.
هذه ليست المرة الأولى التي تقدم فيها جوجل أدوات توليدية ليوتيوب، على الرغم من أن هذا الإعلان سيكون أوسع تكامل للفيديوهات التي تقدمها الشركة حتى الآن. خلال الصيف، أطلقت جوجل أداة تجريبية تسمى Dream Screen لتوليد خلفيات الذكاء الاصطناعي للفيديوهات. وقبل إطلاق المقاطع المولدة بالكامل في العام المقبل، ستقوم جوجل بتحديث أداة الشاشة الخضراء للذكاء الاصطناعي هذه بنموذج Veo في وقت ما خلال الأشهر القليلة المقبلة.
لقد عرضت شركة التكنولوجيا المترامية الأطراف العديد من نماذج الفيديو التي تعمل بالذكاء الاصطناعي في السنوات الأخيرة، مثل Imagen وLumiere، لكنها تحاول توحيد رؤية أكثر توحدًا مع نموذج Veo. يقول كولينز: “بالمناسبة، سيكون Veo نموذجنا في المستقبل. لا ينبغي أن تتوقع خمسة نماذج أخرى منا”. نعم، من المرجح أن تطلق Google نموذج فيديو آخر في النهاية، لكنه يتوقع التركيز على Veo في المستقبل القريب.
تواجه شركة جوجل منافسة من العديد من الشركات الناشئة التي تعمل على تطوير أدواتها الخاصة لتحويل النصوص إلى مقاطع فيديو. ويعد Sora من OpenAI المنافس الأكثر شهرة، ولكن نموذج الفيديو الذي يعمل بالذكاء الاصطناعي، والذي تم الإعلان عنه في وقت سابق من عام 2024، لم يتوفر للجمهور بعد وهو مخصص لعدد صغير من المختبرين. أما بالنسبة للأدوات المتاحة على نطاق واسع، فقد أصدرت شركة Runway الناشئة في مجال الذكاء الاصطناعي إصدارات متعددة من برنامج الفيديو الخاص بها، بما في ذلك أداة حديثة لتكييف مقاطع الفيديو الأصلية إلى إصدارات واقعية بديلة للمقطع.
يأتي إعلان يوتيوب في الوقت الذي أصبحت فيه أدوات الذكاء الاصطناعي التوليدية أكثر إثارة للجدل بالنسبة للمبدعين، الذين ينظرون أحيانًا إلى الموجة الحالية من الذكاء الاصطناعي على أنها تسرق من أعمالهم وتحاول تقويض العملية الإبداعية. لا ترى علي أن أدوات الذكاء الاصطناعي التوليدية تأتي بين المبدعين ومصداقية علاقتهم بالمشاهدين. تقول: “هذا حقًا يتعلق بالجمهور وما يهتمون به – وليس بالضرورة بالأدوات”. “ولكن إذا كان جمهورك مهتمًا بكيفية إنشائك لها، فسيكون ذلك مفتوحًا من خلال الوصف”. تخطط Google لوضع علامة مائية على كل فيديو ذكاء اصطناعي تم إنشاؤه لمقاطع YouTube Shorts باستخدام SynthID، والذي يدمج علامة غير محسوسة للمساعدة في تحديد الفيديو على أنه مصطنع، بالإضافة إلى تضمين إخلاء مسؤولية “صُنع باستخدام الذكاء الاصطناعي” في الوصف.
يحاول المؤثرون في ثقافة الصخب بالفعل التلاعب بالخوارزمية باستخدام أدوات متعددة من جهات خارجية لأتمتة العملية الإبداعية وكسب المال بأقل جهد. هل يؤدي دمج Veo في العام المقبل إلى سيل جديد من مقاطع الفيديو القصيرة منخفضة الجودة والمزعجة على YouTube والتي تهيمن على خلاصات المستخدمين؟ تقول علي: “أعتقد أن تجربتنا في التوصية بالمحتوى المناسب للمشاهد المناسب تعمل في عالم الذكاء الاصطناعي هذا، لأننا كنا نفعل ذلك على هذا النطاق الضخم”. كما تشير إلى أن إرشادات YouTube القياسية لا تزال سارية بغض النظر عن الأداة المستخدمة لصياغة الفيديو.
غالبًا ما يكون للفن الذي يتم إنتاجه باستخدام الذكاء الاصطناعي جماليات مميزة، وهو ما قد يكون مثيرًا للقلق بالنسبة لمنشئي الفيديو الذين يقدرون الفردية ويريدون أن يشعر محتواهم بالتفرد. ويأمل كولينز ألا تكون بصمات جوجل واضحة في جميع مخرجات الفيديو التي يتم إنتاجها باستخدام الذكاء الاصطناعي. ويقول: “لا أريد أن ينظر الناس إلى هذا ويقولوا، “أوه، هذا هو نموذج DeepMind”. إن الحصول على الدافع لإنتاج مخرجات الذكاء الاصطناعي بما يتماشى مع ما تصوره المبدع هو هدف أساسي، وتجنب الجماليات الواضحة لـ Veo أمر بالغ الأهمية لتحقيق القدرة على التكيف على نطاق واسع.
يقول كولينز: “إن جزءًا كبيرًا من الرحلة يتلخص في بناء شيء مفيد للناس وقابل للتطوير والتنفيذ. إنه ليس مجرد عرض توضيحي. إنه يُستخدم في منتج حقيقي”. ويعتقد أن وضع أدوات الذكاء الاصطناعي التوليدي داخل تطبيق YouTube مباشرةً سيكون تحويليًا للمبدعين، وكذلك لـ DeepMind. ويقول: “لم نقم أبدًا بإنشاء منتج للمبدعين. وبالتأكيد لم نقم بذلك على هذا النطاق من قبل”.