موقع OpenAI Sora الجديد لتحويل النص الى فيديو بالذكاء الاصطناعي
لا يخفى على أحد قدرة روبوتات الدردشة من OpenAI على اجتياز امتحان نقابة المحامين دون الحاجة إلى الذهاب إلى كلية الحقوق. والآن، تزامناً مع حفل توزيع جوائز الأوسكار، يأتي تطبيق OpenAI الجديد المسمى بـ “Sora” ليطمح بإتقان صناعة السينما دون الحاجة إلى الذهاب إلى مدرسة السينما. يعتبر Sora حاليًا منتجًا بحثيًا محدود الاستخدام على عدد قليل من المبدعين المختارين وعدد من خبراء الأمن الذين سيخضعونه لاختبارات صارمة لاكتشاف ثغرات الأمان. تخطط OpenAI لإتاحته لجميع صانعي الأفلام الطموحين في تاريخ غير محدد، لكنها قررت عرضه مسبقًا.
كشفت شركات أخرى، من عمالقة مثل Google إلى شركات ناشئة مثل Runway، بالفعل عن مشاريع ذكاء اصطناعي لتحويل النصوص إلى مقاطع فيديو. لكن OpenAI تقول إن ما يميز Sora هو واقعيته التصويرية المذهلة – وهو شيء لم أره في منافسيها – وقدرته على إنتاج مقاطع أطول من المقاطع القصيرة النموذجية التي تقدمها النماذج الأخرى، حيث تصل مدتها إلى دقيقة واحدة. لم يوضح الباحثون الذين تحدثت إليهم المدة التي يستغرقها عرض كل هذا الفيديو، ولكن عندما أُلح عليهم، وصفوها بأنها أقرب إلى “الخروج لتناول بوريتو” من “أخذ بضعة أيام راحة”. إذا كان من الممكن تصديق الأمثلة المختارة يدويًا التي رأيتها، فإن الجهد يستحق ذلك.
يتم حاليًا حصر الوصول إلى Sora على فريق مختص يُعرف بـ “فريق التقييم الأمني” (Red Team) مهمته تقييم المخاطر والأضرار المحتملة التي قد تنجم عن استخدامها.
إضافةً إلى ذلك، منحت OpenAI حق الوصول المحدود لعدد من الفنانين التشكيليين والمصممين وصانعي الأفلام بهدف الاستفادة من ملاحظاتهم وآرائهم في تطوير هذه الأداة الإبداعية. حيث أكدت الشركة على وجود تحدياتٍ تقنية، إذ لا تتمكن Sora حالياً من محاكاة دقيقة لفيزياء مشاهد معقدة، كما تواجه صعوبات في تفسير بعض العلاقات السببية والنتائجية بطريقة صحيحة.
يأتي إطلاق Sora بعد إعلان OpenAI في وقت سابق من هذا الشهر عن إضافة علامات مائية إلى أداة “DALL-E 3” التي تحول النصوص إلى صور، مع الإشارة إلى إمكانية إزالتها بسهولة. ويشير هذا إلى التحديات المشتركة التي تواجهها تقنيات OpenAI المتقدمة، خاصة ما يتعلق بإمكانية إنشاء وتداول مقاطع فيديو مزيفة وواقعية باستخدام الذكاء الاصطناعي، مما يثير تساؤلات حول مدى مصداقية المحتوى المتداول على الإنترنت.
اخترنا لك: أفضل مواقع الدردشة مع الذكاء الاصطناعي مجانا
قدرات محسَّنة في إنشاء الفيديوهات باستخدام الذكاء الاصطناعي: أبرز ميزات Sora
- تنوع الأساليب: تستطيع Sora توليد مقاطع فيديو بأسلوب واقعي أو رسوم متحركة، بالأبيض والأسود أو بالألوان، وغير ذلك.
- التماسك المنطقي: لا تقع Sora في فخ “غرابة الذكاء الاصطناعي”، حيث تحافظ على منطقية المشاهد وتجنب تحركات الأشياء بطرق مستحيلة فيزيائياً.
- مدة أطول: تصل مدة الفيديوهات التي تُنشئها Sora إلى دقيقة كاملة، وهو تقدم ملحوظ مقارنة بالنماذج الأخرى المقتصرة على ثوانٍ معدودة.
مثال توضيحي:
يمكنكم مشاهدة مقطع فيديو جولة داخل معرض فني، تم إنشاؤه بالكامل باستخدام Sora. يُظهر هذا المثال قدرة الأداة على تجاوز القيود السابقة وإنشاء مقاطع فيديو مترابطة ومتسقة:
تُقدم Sora إمكانيات إبداعية واسعة مثل هذا الفيديو الذي يُظهر تفتح زهرة بطريقة طبيعية وسلسة:
أداة “سُوْرا” للذكاء الاصطناعي: قُدرات رائعة ولكن بحذر!
تقدم أداة Sora من OpenAI إمكانيات مذهلة لإنشاء مقاطع فيديو واقعية ومتماسكة، إلا أنها لا تزال قيد التطوير والبحث بسبب بعض التحديات التي تواجهها. منها:
- صعوبة محاكاة الفيزياء في المشاهد المعقدة (مثل عدم ظهور أثر قضمة على الكوكيز).
- إمكانية الخلط بين الاتجاهات المكانية (يمين/يسار).
- عدم القدرة على التعامل الدقيق مع أحداث متسلسلة (مثل مسار كاميرا محدد).
موقف OpenAI من Sora
- لا تُعتبر Sora جاهزة للاستخدام العام بسبب مخاطر سوء الاستخدام.
- تتعاون OpenAI مع الخبراء لتحديد نقاط الضعف وتطوير أدوات كشف أصل الفيديوهات المُنشأة بـ Sora.
- تخطط OpenAI لتضمين بيانات المصدر في حال إتاحة الأداة للجمهور.
- ستعمل OpenAI مع الجهات المعنية لفهم المخاوف وتحديد التطبيقات الإيجابية.
مصادر: wired , OpenAI , theverge , techcrunch