هلدینگ چینی علیبابا در روز چهارشنبه اعلام کرد که مدل هوش مصنوعی جدید خود به نام Wan 2.1 را بهصورت عمومی و متنباز در دسترس کاربران قرار داده است. این مدل توانایی تولید تصاویر و ویدیوهای واقعگرایانه با ورودیهای متنی و تصویری را دارد و با این اقدام، رقابت در حوزه هوش مصنوعی بیش از پیش تشدید خواهد شد.
طبق گزارش رویترز، علیبابا چهار نسخه مختلف از این مدل را منتشر کرده است: T2V-1.3B، T2V-14B، I2V-14B-720 و I2V-14B-480P. این مدلها که از 14 میلیارد پارامتر بهره میبرند، قادر به پردازش دادههای بیشتر و تولید نتایج دقیقتری هستند. این مدلها بهطور جهانی از طریق پلتفرمهای ModelScope علیبابا کلود و Hugging Face برای اهداف تحقیقاتی، تجاری و آکادمیک در دسترس خواهند بود.
این خبر پس از اعلام مشابهی از استارتاپ DeepSeek منتشر شد که مدلهای متنباز و کمهزینه خود را عرضه کرده است و توانسته توجه سرمایهگذاران فناوری را به خود جلب کند. عملکرد قابلرقابت این استارتاپ با شرکتهای بزرگی چون OpenAI، شگفتیهایی در صنعت هوش مصنوعی ایجاد کرده است.
علیبابا در ماه ژانویه نسخه جدیدی از مدل تولید ویدیو و تصویر خود را معرفی کرد که نام آن از Wanx به Wan تغییر یافته است. این شرکت اعلام کرده است که یکی از ویژگیهای برجسته این مدل توانایی تولید تصاویر بسیار واقعگرایانه است. همچنین، علیبابا با اشاره به موفقیت این مدل در رتبهبندی VBench (پلتفرم ارزیابی مدلهای تولید ویدیو)، اعلام کرده که مدل Wan 2.1 در زمینه تعامل با چند شیء در یک ویدیو نسبت به رقبای خود عملکرد بهتری از خود نشان داده است.
در نهایت، علیبابا خبر داده که در طی سه سال آینده حداقل 380 میلیارد یوان (معادل 52 میلیارد دلار) را در زیرساختهای رایانش ابری و هوش مصنوعی سرمایهگذاری خواهد کرد.