Imagen 3

گوگل ابزار قدرتمند تولید تصویر AI خود به نام Imagen 3 را در Gemini ارائه کرد

گوگل، Imagen 3 — هوش مصنوعی قدرتممند مولد تصویر این شرکت — را به Gemini، چت‌بات هوش مصنوعی خود آورده است. این یعنی کاربران می‌توانند تصاویر را از طریق این دستیار هوش مصنوعی به روشی مشابه با DALL-E در ChatGPT تولید کنند. اما یک محدودیت وجود دارد: کاربران نمی‌توانند تصاویر افراد را تولید کنند.

تولید تصاویر افراد فقط در دسترسی اولیه Gemini Advanced ممکن است. گوگل یک دوره آزمایشی رایگان یک ماهه از Gemini Advanced ارائه می‌دهد و پس از آن هزینه‌ای معادل ۱۹.۹۹ دلار در ماه دارد.

Imagen 3 قبلاً فقط برای سرویس AI Test Kitchen گوگل در دسترس بود، اما انتقال آن به Gemini به معنی آن است که تعداد بیشتری از مردم می‌توانند از این مدل استفاده کنند.

Imagen 3

گوگل می‌گوید: «Imagen 3 با کیفیت‌ترین مدل متن به تصویر ما است که قادر است تصاویر را با جزئیات بهتر، نورپردازی غنی‌تر و تعداد کمتری از ایرادات حواس‌پرت‌کننده نسبت به مدل‌های قبلی ما تولید کند.»

«ما به طور قابل توجهی توانایی Imagen 3 را در فهم درخواست‌ها بهبود داده‌ایم که این به مدل‌ها کمک می‌کند تا طیف گسترده‌ای از سبک‌های بصری را تولید کرده و جزئیات کوچک درخواست‌های طولانی‌تر را به تصویر بکشند.»

بیشتر بخوانید: گوگل هوش مصنوعی تصویرساز قدرتمند خود را به صورت رایگان عرضه کرد

اطلاعات کمی درباره داده‌هایی که برای آموزش Imagen 3 استفاده شده، منتشر شده است. در مقاله‌ای، گوگل می‌گوید: «مدل Imagen 3 بر روی یک مجموعه داده بزرگ شامل تصاویر، متن و توضیحات مرتبط آموزش داده شده است.» به احتمال زیاد این مجموعه شامل تعداد زیادی عکس دارای حق‌کپی است.

علاوه بر تولید تصاویر، گوگل گزینه ویرایش تصاویر با استفاده از تکنیک مرسوم inpainting را نیز ارائه می‌دهد. این روش به کاربر امکان می‌دهد بخشی از تصویر را انتخاب کرده و تغییرات دلخواه خود را وارد کند.

Imagen 3

برخلاف مولد تصویر هوش مصنوعی Grok متعلق به ایلان ماسک، گوگل محدودیت‌هایی برای Imagen 3 قرار داده است.

با این حال، همانطور که به خوبی مستند شده، روش‌هایی برای دور زدن این محدودیت‌ها وجود دارد. برای مثال، با درخواست از Imagen 3 برای “ساخت یک عکس سیاه و سفید دراماتیک گرفته شده در سال ۱۹۴۲ از پارک ملی Grand Teton در وایومینگ”، کاربر تصویری مشابه آثار انسل آدامز دریافت خواهد کرد.

اوایل امسال، گوگل پس از آنکه مولد تصویر هوش مصنوعی‌اش در Gemini به دلیل تصحیح بیش از حد تعصبات و در واقع “پاک کردن سفیدپوستان” مورد اتهام قرار گرفت، مجبور شد این مولد را به طور کامل حذف کند.

برای امتحان Imagen 3 در Gemini، به Gemini مراجعه کنید.