·11 دی 1404·0

Qwen-Image-2512 معرفی شد؛ رقیب رایگان مدل‌های حرفه‌ای تولید تصویر

با افزایش استفاده از مدل‌های هوش مصنوعی در تولید تصویر، موضوع هزینه و وابستگی به زیرساخت‌های ابری اختصاصی به یکی از چالش‌های اصلی کاربران حرفه‌ای و سازمان‌ها تبدیل شده است. در این فضا، تیم Qwen وابسته به علی‌بابا از مدل جدیدی با نام Qwen-Image-2512 رونمایی کرده؛ مدلی که تلاش می‌کند کیفیت بالا را در کنار دسترسی آزاد و رایگان ارائه دهد.

برخلاف برخی مدل‌های مطرح تولید تصویر که استفاده حرفه‌ای از آن‌ها مستلزم پرداخت هزینه‌های قابل توجه و اتصال دائمی به سرویس‌های ابری است، Qwen-Image-2512 به‌صورت متن‌باز و تحت لایسنس Apache 2.0 منتشر شده است. این مجوز به توسعه‌دهندگان و شرکت‌ها اجازه می‌دهد بدون محدودیت حقوقی، از مدل استفاده کنند، آن را شخصی‌سازی کنند و حتی در پروژه‌های تجاری به‌کار بگیرند.

این مدل هم‌اکنون از طریق رابط Qwen Chat در دسترس قرار دارد و نسخه‌های مختلف آن نیز در پلتفرم‌های Hugging Face و ModelScope منتشر شده‌اند. علاوه بر این، برای کاربرانی که قصد آزمایش سریع مدل را دارند، دموی آنلاین بدون نیاز به نصب در Hugging Face و نسخه مرورگری ModelScope فراهم شده است. کسب‌وکارهایی که به سرویس مدیریت‌شده نیاز دارند نیز می‌توانند از طریق Model Studio در علی‌بابا کلاد به Qwen-Image-2512 دسترسی پیدا کنند.

تمرکز Qwen-Image-2512 بر چه قابلیت‌هایی است؟

بر اساس توضیحات ارائه‌شده، Qwen-Image-2512 بر سه حوزه کلیدی تمرکز دارد که برای استفاده‌های حرفه‌ای و سازمانی اهمیت بالایی دارند.

نخست، واقع‌گرایی چهره و انسجام محیطی. این مدل تلاش کرده جلوه‌های مصنوعی رایج در تولید چهره را کاهش دهد و نمایش طبیعی‌تری از سن، بافت پوست و حالات چهره ارائه کند. همچنین عناصر پس‌زمینه با ارتباط بصری و معنایی دقیق‌تری تولید می‌شوند؛ موضوعی که برای محتوای آموزشی، شبیه‌سازی و ارتباطات سازمانی اهمیت دارد.

دوم، دقت در نمایش بافت‌ها و متریال‌ها. مناظر طبیعی، آب، مو و سطوح مختلف مواد با جزئیات بیشتری رندر می‌شوند. این ویژگی علاوه بر بهبود کیفیت بصری، می‌تواند نیاز به اصلاحات بعدی و هزینه‌های تکمیلی را کاهش دهد.

سوم، تولید متن و چیدمان ساختاریافته در تصویر. دقت مدل در تولید متن داخل تصویر و حفظ انسجام چیدمان افزایش یافته و این موضوع باعث شده طراحی پوسترها، اسلایدها و اینفوگرافیک‌ها خواناتر و دقیق‌تر باشد.

بر اساس ارزیابی‌های انجام‌شده در AI Arena علی‌بابا، Qwen-Image-2512 در میان مدل‌های متن‌باز تولید تصویر، عملکردی برجسته داشته و حتی در مقایسه با برخی سیستم‌های بسته نیز نتایج نزدیکی ارائه کرده است. با این حال، نقطه تمایز اصلی این مدل را می‌توان در شیوه انتشار و مجوز استفاده آن دانست؛ عاملی که می‌تواند نقش مهمی در گسترش استفاده از آن در پروژه‌های حرفه‌ای ایفا کند.