متا بهتازگی از ابزار تولید ویدئو مبتنی بر هوش مصنوعی خود با نام Movie Gen رونمایی کرده و چند نمونه چشمگیر از آن را نمایش داده است، اما هنوز تاریخی برای عرضه رسمی این محصول اعلام نشده است.
در حالی که فضای تولید ویدئوهای مبتنی بر هوش مصنوعی در حال داغتر شدن است، اما بهطور همزمان روند آن کندتر شده است؛ اکنون هفت ماه از اعلام ابزار Sora توسط OpenAI گذشته است و هنوز مشخص نیست که چه زمانی عرضه خواهد شد.
استارتاپهای کوچک فعال در حوزه هوش مصنوعی، مدلهای جالبی عرضه کردهاند اما هنوز مشخص نیست که کدام شرکت در بازار نوظهور ویدئوهای هوش مصنوعی موفقتر خواهد بود.
یکی از مشکلات این است که مدلهای ویدئوی هوش مصنوعی هنوز به محصولات کاربردی تبدیل نشدهاند. کاربران باید مدت زمان زیادی را پس از وارد کردن درخواست منتظر بمانند تا ویدئوها ظاهر شوند، چیزی که «کریس کاکس» مدیر محصول متا نیز آن را تأیید کرده است.
او در Threads مینویسد: «ما هنوز آماده عرضه این به عنوان محصول نیستیم — این فناوری هنوز گران است و زمان تولید بسیار طولانی است — اما میخواستیم پیشرفتهایی که داشتهایم را به اشتراک بگذاریم، زیرا نتایج واقعاً چشمگیر شدهاند.»
با این حال، کاکس میگوید که این مدل «پیشرو در صنعت» است. ویدئوها در Movie Gen میتوانند از طریق یک درخواست متنی یا با استفاده از یک تصویر ثابت یا ویدئوی متحرک تولید شوند.
این مدل همچنین قابلیت تطابق صداهای تولیدشده توسط هوش مصنوعی با تصاویر ویدئویی تولید شده را دارد و ویدئوها میتوانند در نسبتهای مختلف تصویر ساخته شوند — ویژگیهایی که در مدلهای رقیب نیز وجود دارد.
یکی از نمونههایی که متا در صفحه Movie Gen خود ارائه کرده است، فیلمی از یک دونده در بیابان است. این ویدئو تغییراتی داشته است، در یک نسخه به دستهای دونده پومپومهای آبی اضافه شده، در نسخه دیگری او در میان کاکتوسها میدود و در نسخه سوم لباس ورزشیاش با یک لباس بادی به شکل دایناسور جایگزین شده است.
دادههای آموزشی چه بودند؟
متا، مانند همه شرکتهای هوش مصنوعی، در مورد دادههایی که Movie Gen بر روی آنها آموزش دیده است اطلاعات مبهمی ارائه داده است. تنها اعلام کرده که این دادهها ترکیبی از دادههای دارای مجوز و دادههای عمومی هستند.
در ماه ژوئیه اعلام شد که استارتاپ هوش مصنوعی Runway صدها ویدئوی یوتیوب را برای ساخت آخرین مدل خود به نام Gen-3 جمعآوری کرده است.
گمان میرود که متا به دلیل اصرار بر اینکه حق استفاده از دادههای ایجاد شده توسط میلیونها کاربر شبکههای اجتماعیاش را برای آموزش هوش مصنوعی دارد، نسبت به رقبا مزیتی کسب کرده است.