گوگل بهتازگی مدل جدید هوش مصنوعی خود با نام Imagen 4 را برای تولید تصویر از متن معرفی کرده و دسترسی رایگان به این مدل را بهصورت محدود در اختیار کاربران قرار داده است. استفاده از این مدل در حال حاضر تنها از طریق پلتفرم Google AI Studio امکانپذیر است و کاربران میتوانند در مدت زمانی محدود بدون پرداخت هزینه از قابلیتهای آن بهره ببرند.
Imagen 4 در ادامه مسیر توسعه مدلهای متن به تصویر گوگل ارائه شده و نسبت به نسخههای قبلی خود، از جمله Imagen 3، از نظر کیفیت بصری، دقت در اجرای دستورها و سرعت تولید تصویر، بهطور محسوسی ارتقا یافته است. طبق اعلام گوگل، سرعت ساخت تصاویر در این مدل تا ۱۰ برابر نسبت به نسخه قبل افزایش یافته و توانایی آن در بازتولید دقیق جزئیاتی مانند بافتها، نورپردازی طبیعی و حتی تایپوگرافی نیز قابل توجه است.
گوگل دو نسخه از این مدل را منتشر کرده است. نسخه استاندارد Imagen 4 که برای کاربری عمومی و تولید تصاویر روزمره بهینهسازی شده و نسخه پیشرفتهتر آن با نام Imagen 4 Ultra که بهعنوان مدل پرچمدار گوگل در این حوزه شناخته میشود. نسخه Ultra بهویژه برای پروژههایی که به دقت بصری بالا و پاسخ دقیق به متن نیاز دارند مناسبتر است. هزینه استفاده از مدل پایه ۰.۰۴ دلار به ازای هر تصویر است، در حالی که نسخه Ultra با قیمت ۰.۰۶ دلار ارائه میشود.
گوگل همچنین اعلام کرده است که Imagen 4 هنوز در سرویس Gemini ارائه نشده، اما کاربران نسخه پریمیوم این پلتفرم میتوانند در هفتههای آینده به آن دسترسی پیدا کنند. افزون بر این، پشتیبانی از Imagen 4 در سرویسهای دیگر گوگل مانند Vertex AI و اپلیکیشنهای Google Workspace نیز در دستور کار قرار دارد.
یکی از قابلیتهای قابل توجه این مدل، امکان تولید تصاویر با نسبتهای مختلف ابعاد برای استفاده در فرمتهای متنوع از جمله شبکههای اجتماعی، پوستر، تبلیغات و ویدیوهای عمودی است. همچنین گوگل از سیستم علامتگذاری دیجیتال SynthID برای افزودن واترمارک نامرئی به تصاویر استفاده میکند تا اصالت هوش مصنوعی بودن تصاویر قابل ردیابی باشد.
Imagen 4 در رویداد Google I/O 2025 معرفی شد و در کنار سایر محصولات هوش مصنوعی گوگل مانند Gemini 2.5 Pro، مدل ویدیوساز Veo و ابزارهای مولتیمدیا مانند Flow، بخشی از استراتژی جدید این شرکت برای توسعه نسل تازهای از ابزارهای هوش مصنوعی خلاق به شمار میرود.
این مدل نه تنها با رقبای قدرتمندی مانند DALL·E OpenAI و Midjourney وارد رقابت شده، بلکه بهدلیل کیفیت بالا، دقت متنی و سرعت عملکرد، میتواند یکی از بازیگران اصلی در آینده تصویرسازی هوشمند باشد. کاربران حرفهای، طراحان و توسعهدهندگان میتوانند در مدت محدود از فرصت تست رایگان این مدل در AI Studio بهره ببرند.