در کنفرانس Google I/O 2025 که دیروز برگزار شد، گوگل از طیفی گسترده از نرمافزارها، فناوریها و ویژگیهای جدید در اکوسیستم خود رونمایی کرد؛ از جمله نسخههای بهروزشده مدلهای هوش مصنوعی مولد خود برای تولید تصویر و ویدیو. گوگل در پست وبلاگ رسمی خود این مدلها را «پیشرفتهایی چشمگیر» توصیف کرده است.
«این مدلها تصاویر، ویدیوها و موسیقیهای خیرهکنندهای خلق میکنند و به هنرمندان این امکان را میدهند که دیدگاه خلاقانه خود را محقق کنند. همچنین ابزارهای فوقالعادهای را در اختیار همه قرار میدهند تا خود را بیان کنند.»
Veo 3
Veo 3 جدیدترین مدل تولید ویدیوی گوگل است که طبق گفته شرکت، نسبت به نسخه قبلی (Veo 2) کیفیت خروجی بالاتری دارد و برای نخستینبار امکان تولید صدا را نیز به ویدیوها اضافه کرده است. این صداها شامل افکتهای محیطی مرتبط و حتی دیالوگ میان شخصیتها میشود.
گوگل میگوید Veo 3 در تولید متن و صحنههای فوتورئالیستی بسیار توانمند است و نسبت به نسخههای قبلی، بهتر میتواند فیزیک دنیای واقعی را بازسازی کند. همچنین امکان هماهنگی لب با دیالوگ (lip sync) نیز در این نسخه فراهم شده است.
«در درک مفهوم بسیار قوی است. شما میتوانید یک داستان کوتاه در قالب یک پرامپت تعریف کنید و این مدل، کلیپی تولید میکند که آن داستان را زنده میکند.»
Veo 3 هماکنون از طریق اپلیکیشن Gemini و پلتفرم Flow برای کاربران اشتراک Ultra در ایالات متحده در دسترس است. همچنین کاربران سازمانی از طریق Vertex AI به آن دسترسی دارند.
Google Imagen 4
نسخه جدید مدل تولید تصویر گوگل به نام Imagen 4 سرعت و عملکرد بالاتری نسبت به نسخه قبلی دارد. این مدل در تولید جزئیات دقیق مانند بافتهای پیچیده، قطرات آب و خز عملکرد بسیار بهتری دارد. گوگل میگوید Imagen 4 هم برای تولید تصاویر فوتورئالیستی و هم آثار انتزاعی مناسب است.
این مدل اکنون قادر است تصاویری با نسبت ابعاد متنوعتر و وضوحی تا 2K تولید کند و همچنین در تولید متن درون تصویر بسیار پیشرفت داشته است.
نمونههایی از قابلیتهای Imagen 4:




Imagen 4هماکنون از طریق پلتفرمهای Gemini، Whisk و Vertex AI در دسترس است و به برنامههای Workspace گوگل مانند Docs و Slides نیز افزوده شده است. گوگل همچنین اعلام کرده که بهزودی نسخهای سریعتر از Imagen 4 عرضه میکند که تا ۱۰ برابر سریعتر از Imagen 3 عمل میکند
Google Ultra
همانطور که پیشتر اشاره شد، Veo 3 فقط از طریق اشتراک جدید Google AI Ultra قابل دسترسی است؛ اشتراکی که امروز معرفی شد و وعده داده میشود دسترسی به «قدرتمندترین مدلهای هوش مصنوعی گوگل و ویژگیهای ویژه» را فراهم کند.
قیمت این اشتراک ۲۴۹.۹۹ دلار در ماه است، اما کاربران جدید (که فعلاً همه شامل آن میشوند) میتوانند در سه ماه اول از تخفیف ۵۰ درصدی بهرهمند شوند.
محتویات اشتراک Google AI Ultra شامل:
- نسخه برتر Gemini
- دسترسی به Veo 3، Flow، Whisk، NotebookLM
- ادغام با اپلیکیشنهای گوگل، Chrome، پروژه Mariner
- اشتراک YouTube Premium
- ۳۰ ترابایت فضای ابری برای استفاده در Drive، Photos و Gmail
این اشتراک فعلاً فقط در ایالات متحده ارائه میشود، اما گوگل وعده داده آن را به کشورهای دیگر نیز گسترش خواهد داد.
Google Flow
Flow یکی از بخشهای اشتراک Ultra و همچنین برنامه Google AI Pro است که برای نسل بعدی خلاقان طراحی شده و از مدلهای پیشرفته گوگل مانند Veo، Imagen و Gemini بهره میبرد.
گوگل Flow را «تنها ابزار فیلمسازی هوش مصنوعی که مخصوص مدلهای پیشرفته گوگل طراحی شده» معرفی میکند. هدف آن کمک به داستانپردازان برای پرورش ایدهها و تولید کلیپها و صحنههای مورد نظرشان است.
«Flow الهامگرفته از لحظاتیست که زمان کند میشود و فرایند خلق، روان و پر از امکان است. این ابزار با مدل Veo طراحی شده و خروجیهایی با جلوههای سینمایی خیرهکننده و پایبندی دقیق به پرامپت تولید میکند. در پشت صحنه، مدلهای Gemini تجربه پرامپتدهی را ساده میکنند تا شما بتوانید با زبان روزمره چشمانداز خود را توصیف کنید. همچنین میتوانید داراییهای خودتان را وارد کرده یا با استفاده از Imagen شخصیت و عناصر تصویری خود را بسازید.»
Flow ابزارهای حرفهای متعددی دارد، از جمله کنترل مستقیم دوربین، گسترش صحنه، مدیریت داراییها و موارد دیگر. این ابزار بر پایه VideoFX طراحی شده که سال گذشته در آزمایشگاههای گوگل معرفی شد.
Flow هماکنون برای کاربران Google AI Pro و Ultra قابل استفاده است؛ هرچند دسترسی به Veo 3 در حال حاضر فقط برای کاربران Ultra فعال است.