Alibaba تُطوّر أداة جديدة لتوليد الفيديو بالذكاء الاصطناعي
عملاق التّجارة الإلكترونيّة الصّينيّ يُعلن عن تطوير أداة Tora لإنشاء الفيديو باستخدام تقنية (DiT)، المستوحاة من نموذج Sora الذي أطلقتهُ OpenAI
هذا المقالُ متوفّرٌ باللّغة الإنجليزيّة من هنا.
تُطوِّر شركةُ Alibaba Group Holding، عملاقُ التّجارة الإلكترونيّة الصّينيّ، أداةً جديدةً لتوليد الفيديو تُدعى "Tora"، مُستوحاةً من نموذج "Sora" الّذي أطلقتهُ OpenAI في فبراير الماضي. وفقاً لورقةٍ بحثيّةٍ نُشرت من قبل خمسة باحثين من Alibaba، تُستخدم Tora هيكليّة Diffusion Transformer (DiT)، وهي نفسُ الإطارِ المُستخدم في Sora، النّموذج الّذي يُحوِّل النّصوصَ إلى فيديو.
تُعتبر Tora أوّل إطار عملٍ من نوعهِ لتوليدِ الفيديو باستخدامِ DiT، ممّا يضمنُ حركةً دقيقةً على طولِ المساراتِ المُحدّدةِ مع محاكاةِ الدّيناميّات الواقعيّة، وكيّف الباحثون سيرَ العملِ في OpenSora، لتحويلِ مقاطع الفيديو الخامّ إلى أزواجٍ عالية الجودة من الفيديو والنّصوص، وتستطيعُ Tora توليدَ مقاطع فيديو موجّهةً بالمسارات، والصّور، والنّصوص، أو مزيج منها، ولم يتمّ الكشف بعد عن موعد تُوفّر Tora للجمهور.
في وقتٍ سابقٍ من هذا العام، أطلقت Alibaba نموذج Emote Portrait Alive (EMO) في فبراير، وهو نموذجُ ذكاء اصطناعي يُنشئ مقاطع فيديو لصورٍ رمزيّةٍ مُتحرّكةٍ من صورةٍ ثابتةٍ واحدةٍ وعيّنةٍ صوتيّةٍ.
وفي فبراير أيضاً، قدّمت OpenAI نموذجَ Sora، أوّل نموذجٍ لتوليد الفيديو باستخدامِ الذّكاء الاصطناعيّ يعتمدُ على تحويلِ النّصوص إلى مقاطع فيديو، ويستخدمُ Sora نموذجَ اللّغة GPT-3 من OpenAI، لتحويلِ الوصفِ النّصيّ إلى محتوى فيديو، ممّا يُوفّر لصنّاع المُحتوى، والمخرجين، ورواة القصصِ وسيلةً جديدةً لإنشاءِ مشاهد بصريّةً.
يتميّز Sora بقدرتهِ على إنشاءِ مشاهدَ تفصيليّة تحتوي على عدّة مُمثّلين، وأنماط حركةٍ متنوّعةٍ، وخلفيّاتٍ دقيقةٍ، ممّا يفتحُ آفاقاً جديدةً للإبداعِ في مجالِ صناعةِ الفيديو. ويُظهر تطويرُ Tora التزامَ Alibaba بتقديمِ أحدثِ التّقنيات، لتعزيزِ قدراتِ الذّكاء الاصطناعيّ في توليدِ الفيديو، ممّا يُعزّزُ مكانتها الرّياديّة في هذا المجالِ الواعدِ.