·9 اسفند 1403·0

علی‌بابا مدل هوش مصنوعی تولید ویدیو و تصویر خود را برای عموم منتشر کرد

هلدینگ چینی علی‌بابا در روز چهارشنبه اعلام کرد که مدل هوش مصنوعی جدید خود به نام Wan 2.1 را به‌صورت عمومی و متن‌باز در دسترس کاربران قرار داده است. این مدل توانایی تولید تصاویر و ویدیوهای واقع‌گرایانه با ورودی‌های متنی و تصویری را دارد و با این اقدام، رقابت در حوزه هوش مصنوعی بیش از پیش تشدید خواهد شد.

طبق گزارش رویترز، علی‌بابا چهار نسخه مختلف از این مدل را منتشر کرده است: T2V-1.3B، T2V-14B، I2V-14B-720 و I2V-14B-480P. این مدل‌ها که از 14 میلیارد پارامتر بهره می‌برند، قادر به پردازش داده‌های بیشتر و تولید نتایج دقیق‌تری هستند. این مدل‌ها به‌طور جهانی از طریق پلتفرم‌های ModelScope علی‌بابا کلود و Hugging Face برای اهداف تحقیقاتی، تجاری و آکادمیک در دسترس خواهند بود.

این خبر پس از اعلام مشابهی از استارتاپ DeepSeek منتشر شد که مدل‌های متن‌باز و کم‌هزینه خود را عرضه کرده است و توانسته توجه سرمایه‌گذاران فناوری را به خود جلب کند. عملکرد قابل‌رقابت این استارتاپ با شرکت‌های بزرگی چون OpenAI، شگفتی‌هایی در صنعت هوش مصنوعی ایجاد کرده است.

علی‌بابا در ماه ژانویه نسخه جدیدی از مدل تولید ویدیو و تصویر خود را معرفی کرد که نام آن از Wanx به Wan تغییر یافته است. این شرکت اعلام کرده است که یکی از ویژگی‌های برجسته این مدل توانایی تولید تصاویر بسیار واقع‌گرایانه است. همچنین، علی‌بابا با اشاره به موفقیت این مدل در رتبه‌بندی VBench (پلتفرم ارزیابی مدل‌های تولید ویدیو)، اعلام کرده که مدل Wan 2.1 در زمینه تعامل با چند شیء در یک ویدیو نسبت به رقبای خود عملکرد بهتری از خود نشان داده است.

در نهایت، علی‌بابا خبر داده که در طی سه سال آینده حداقل 380 میلیارد یوان (معادل 52 میلیارد دلار) را در زیرساخت‌های رایانش ابری و هوش مصنوعی سرمایه‌گذاری خواهد کرد.