هوش مصنوعی تولید ویدئو

متا ابزار تولید ویدئو مبتنی بر هوش مصنوعی خود را به نام Movie Gen معرفی کرد

متا به‌تازگی از ابزار تولید ویدئو مبتنی بر هوش مصنوعی خود با نام Movie Gen رونمایی کرده و چند نمونه چشم‌گیر از آن را نمایش داده است، اما هنوز تاریخی برای عرضه رسمی این محصول اعلام نشده است.

در حالی که فضای تولید ویدئوهای مبتنی بر هوش مصنوعی در حال داغ‌تر شدن است، اما به‌طور هم‌زمان روند آن کندتر شده است؛ اکنون هفت ماه از اعلام ابزار Sora توسط OpenAI گذشته است و هنوز مشخص نیست که چه زمانی عرضه خواهد شد.

استارتاپ‌های کوچک فعال در حوزه هوش مصنوعی، مدل‌های جالبی عرضه کرده‌اند اما هنوز مشخص نیست که کدام شرکت در بازار نوظهور ویدئوهای هوش مصنوعی موفق‌تر خواهد بود.

یکی از مشکلات این است که مدل‌های ویدئوی هوش مصنوعی هنوز به محصولات کاربردی تبدیل نشده‌اند. کاربران باید مدت زمان زیادی را پس از وارد کردن درخواست منتظر بمانند تا ویدئوها ظاهر شوند، چیزی که «کریس کاکس» مدیر محصول متا نیز آن را تأیید کرده است.

او در Threads می‌نویسد: «ما هنوز آماده عرضه این به عنوان محصول نیستیم — این فناوری هنوز گران است و زمان تولید بسیار طولانی است — اما می‌خواستیم پیشرفت‌هایی که داشته‌ایم را به اشتراک بگذاریم، زیرا نتایج واقعاً چشم‌گیر شده‌اند.»

با این حال، کاکس می‌گوید که این مدل «پیشرو در صنعت» است. ویدئوها در Movie Gen می‌توانند از طریق یک درخواست متنی یا با استفاده از یک تصویر ثابت یا ویدئوی متحرک تولید شوند.

این مدل همچنین قابلیت تطابق صداهای تولیدشده توسط هوش مصنوعی با تصاویر ویدئویی تولید شده را دارد و ویدئوها می‌توانند در نسبت‌های مختلف تصویر ساخته شوند — ویژگی‌هایی که در مدل‌های رقیب نیز وجود دارد.

یکی از نمونه‌هایی که متا در صفحه Movie Gen خود ارائه کرده است، فیلمی از یک دونده در بیابان است. این ویدئو تغییراتی داشته است، در یک نسخه به دست‌های دونده پوم‌پوم‌های آبی اضافه شده، در نسخه دیگری او در میان کاکتوس‌ها می‌دود و در نسخه سوم لباس ورزشی‌اش با یک لباس بادی به شکل دایناسور جایگزین شده است.

داده‌های آموزشی چه بودند؟

متا، مانند همه شرکت‌های هوش مصنوعی، در مورد داده‌هایی که Movie Gen بر روی آن‌ها آموزش دیده است اطلاعات مبهمی ارائه داده است. تنها اعلام کرده که این داده‌ها ترکیبی از داده‌های دارای مجوز و داده‌های عمومی هستند.

در ماه ژوئیه اعلام شد که استارتاپ هوش مصنوعی Runway صدها ویدئوی یوتیوب را برای ساخت آخرین مدل خود به نام Gen-3 جمع‌آوری کرده است.

گمان می‌رود که متا به دلیل اصرار بر اینکه حق استفاده از داده‌های ایجاد شده توسط میلیون‌ها کاربر شبکه‌های اجتماعی‌اش را برای آموزش هوش مصنوعی دارد، نسبت به رقبا مزیتی کسب کرده است.