·31 اردیبهشت 1404·0

Google I/O 2025؛ تمرکز ویژه گوگل بر آینده محتوای بصری با هوش مصنوعی

در کنفرانس Google I/O 2025 که دیروز برگزار شد، گوگل از طیفی گسترده از نرم‌افزارها، فناوری‌ها و ویژگی‌های جدید در اکوسیستم خود رونمایی کرد؛ از جمله نسخه‌های به‌روزشده مدل‌های هوش مصنوعی مولد خود برای تولید تصویر و ویدیو. گوگل در پست وبلاگ رسمی خود این مدل‌ها را «پیشرفت‌هایی چشمگیر» توصیف کرده است.

«این مدل‌ها تصاویر، ویدیوها و موسیقی‌های خیره‌کننده‌ای خلق می‌کنند و به هنرمندان این امکان را می‌دهند که دیدگاه خلاقانه خود را محقق کنند. همچنین ابزارهای فوق‌العاده‌ای را در اختیار همه قرار می‌دهند تا خود را بیان کنند.»

فهرست عناوین نمایش

Veo 3

Veo 3 جدیدترین مدل تولید ویدیوی گوگل است که طبق گفته شرکت، نسبت به نسخه قبلی (Veo 2) کیفیت خروجی بالاتری دارد و برای نخستین‌بار امکان تولید صدا را نیز به ویدیوها اضافه کرده است. این صداها شامل افکت‌های محیطی مرتبط و حتی دیالوگ میان شخصیت‌ها می‌شود.

گوگل می‌گوید Veo 3 در تولید متن و صحنه‌های فوتورئالیستی بسیار توانمند است و نسبت به نسخه‌های قبلی، بهتر می‌تواند فیزیک دنیای واقعی را بازسازی کند. همچنین امکان هماهنگی لب با دیالوگ (lip sync) نیز در این نسخه فراهم شده است.

«در درک مفهوم بسیار قوی است. شما می‌توانید یک داستان کوتاه در قالب یک پرامپت تعریف کنید و این مدل، کلیپی تولید می‌کند که آن داستان را زنده می‌کند.»

Veo 3 هم‌اکنون از طریق اپلیکیشن Gemini و پلتفرم Flow برای کاربران اشتراک Ultra در ایالات متحده در دسترس است. همچنین کاربران سازمانی از طریق Vertex AI به آن دسترسی دارند.

Google Imagen 4

نسخه جدید مدل تولید تصویر گوگل به نام Imagen 4 سرعت و عملکرد بالاتری نسبت به نسخه قبلی دارد. این مدل در تولید جزئیات دقیق مانند بافت‌های پیچیده، قطرات آب و خز عملکرد بسیار بهتری دارد. گوگل می‌گوید Imagen 4 هم برای تولید تصاویر فوتورئالیستی و هم آثار انتزاعی مناسب است.

این مدل اکنون قادر است تصاویری با نسبت ابعاد متنوع‌تر و وضوحی تا 2K تولید کند و همچنین در تولید متن درون تصویر بسیار پیشرفت داشته است.

نمونه‌هایی از قابلیت‌های Imagen 4:

Imagen 4هم‌اکنون از طریق پلتفرم‌های Gemini، Whisk و Vertex AI در دسترس است و به برنامه‌های Workspace گوگل مانند Docs و Slides نیز افزوده شده است. گوگل همچنین اعلام کرده که به‌زودی نسخه‌ای سریع‌تر از Imagen 4 عرضه می‌کند که تا ۱۰ برابر سریع‌تر از Imagen 3 عمل می‌کند

Google Ultra

همان‌طور که پیش‌تر اشاره شد، Veo 3 فقط از طریق اشتراک جدید Google AI Ultra قابل دسترسی است؛ اشتراکی که امروز معرفی شد و وعده داده می‌شود دسترسی به «قدرت‌مندترین مدل‌های هوش مصنوعی گوگل و ویژگی‌های ویژه» را فراهم کند.

قیمت این اشتراک ۲۴۹.۹۹ دلار در ماه است، اما کاربران جدید (که فعلاً همه شامل آن می‌شوند) می‌توانند در سه ماه اول از تخفیف ۵۰ درصدی بهره‌مند شوند.

محتویات اشتراک Google AI Ultra شامل:

نسخه برتر Gemini
دسترسی به Veo 3، Flow، Whisk، NotebookLM
ادغام با اپلیکیشن‌های گوگل، Chrome، پروژه Mariner
اشتراک YouTube Premium
۳۰ ترابایت فضای ابری برای استفاده در Drive، Photos و Gmail

این اشتراک فعلاً فقط در ایالات متحده ارائه می‌شود، اما گوگل وعده داده آن را به کشورهای دیگر نیز گسترش خواهد داد.

Google Flow

Flow یکی از بخش‌های اشتراک Ultra و همچنین برنامه Google AI Pro است که برای نسل بعدی خلاقان طراحی شده و از مدل‌های پیشرفته گوگل مانند Veo، Imagen و Gemini بهره می‌برد.

گوگل Flow را «تنها ابزار فیلم‌سازی هوش مصنوعی که مخصوص مدل‌های پیشرفته گوگل طراحی شده» معرفی می‌کند. هدف آن کمک به داستان‌پردازان برای پرورش ایده‌ها و تولید کلیپ‌ها و صحنه‌های مورد نظرشان است.

«Flow الهام‌گرفته از لحظاتی‌ست که زمان کند می‌شود و فرایند خلق، روان و پر از امکان است. این ابزار با مدل Veo طراحی شده و خروجی‌هایی با جلوه‌های سینمایی خیره‌کننده و پایبندی دقیق به پرامپت تولید می‌کند. در پشت صحنه، مدل‌های Gemini تجربه پرامپت‌دهی را ساده می‌کنند تا شما بتوانید با زبان روزمره چشم‌انداز خود را توصیف کنید. همچنین می‌توانید دارایی‌های خودتان را وارد کرده یا با استفاده از Imagen شخصیت و عناصر تصویری خود را بسازید.»

Flow ابزارهای حرفه‌ای متعددی دارد، از جمله کنترل مستقیم دوربین، گسترش صحنه، مدیریت دارایی‌ها و موارد دیگر. این ابزار بر پایه VideoFX طراحی شده که سال گذشته در آزمایشگاه‌های گوگل معرفی شد.

Flow هم‌اکنون برای کاربران Google AI Pro و Ultra قابل استفاده است؛ هرچند دسترسی به Veo 3 در حال حاضر فقط برای کاربران Ultra فعال است.