گوگل، Imagen 3 — هوش مصنوعی قدرتممند مولد تصویر این شرکت — را به Gemini، چتبات هوش مصنوعی خود آورده است. این یعنی کاربران میتوانند تصاویر را از طریق این دستیار هوش مصنوعی به روشی مشابه با DALL-E در ChatGPT تولید کنند. اما یک محدودیت وجود دارد: کاربران نمیتوانند تصاویر افراد را تولید کنند.
تولید تصاویر افراد فقط در دسترسی اولیه Gemini Advanced ممکن است. گوگل یک دوره آزمایشی رایگان یک ماهه از Gemini Advanced ارائه میدهد و پس از آن هزینهای معادل ۱۹.۹۹ دلار در ماه دارد.
Imagen 3 قبلاً فقط برای سرویس AI Test Kitchen گوگل در دسترس بود، اما انتقال آن به Gemini به معنی آن است که تعداد بیشتری از مردم میتوانند از این مدل استفاده کنند.
گوگل میگوید: «Imagen 3 با کیفیتترین مدل متن به تصویر ما است که قادر است تصاویر را با جزئیات بهتر، نورپردازی غنیتر و تعداد کمتری از ایرادات حواسپرتکننده نسبت به مدلهای قبلی ما تولید کند.»
«ما به طور قابل توجهی توانایی Imagen 3 را در فهم درخواستها بهبود دادهایم که این به مدلها کمک میکند تا طیف گستردهای از سبکهای بصری را تولید کرده و جزئیات کوچک درخواستهای طولانیتر را به تصویر بکشند.»
بیشتر بخوانید: گوگل هوش مصنوعی تصویرساز قدرتمند خود را به صورت رایگان عرضه کرد
اطلاعات کمی درباره دادههایی که برای آموزش Imagen 3 استفاده شده، منتشر شده است. در مقالهای، گوگل میگوید: «مدل Imagen 3 بر روی یک مجموعه داده بزرگ شامل تصاویر، متن و توضیحات مرتبط آموزش داده شده است.» به احتمال زیاد این مجموعه شامل تعداد زیادی عکس دارای حقکپی است.
علاوه بر تولید تصاویر، گوگل گزینه ویرایش تصاویر با استفاده از تکنیک مرسوم inpainting را نیز ارائه میدهد. این روش به کاربر امکان میدهد بخشی از تصویر را انتخاب کرده و تغییرات دلخواه خود را وارد کند.
برخلاف مولد تصویر هوش مصنوعی Grok متعلق به ایلان ماسک، گوگل محدودیتهایی برای Imagen 3 قرار داده است.
با این حال، همانطور که به خوبی مستند شده، روشهایی برای دور زدن این محدودیتها وجود دارد. برای مثال، با درخواست از Imagen 3 برای “ساخت یک عکس سیاه و سفید دراماتیک گرفته شده در سال ۱۹۴۲ از پارک ملی Grand Teton در وایومینگ”، کاربر تصویری مشابه آثار انسل آدامز دریافت خواهد کرد.
اوایل امسال، گوگل پس از آنکه مولد تصویر هوش مصنوعیاش در Gemini به دلیل تصحیح بیش از حد تعصبات و در واقع “پاک کردن سفیدپوستان” مورد اتهام قرار گرفت، مجبور شد این مولد را به طور کامل حذف کند.
برای امتحان Imagen 3 در Gemini، به Gemini مراجعه کنید.