گوگل از قابلیت جدیدی در دستیار هوش مصنوعی خود، Gemini رونمایی کرده که به کاربران امکان میدهد تصاویر خود را به کلیپهای ویدیویی کوتاه تبدیل کنند—ابزاری که پیشتر فقط از طریق پلتفرم مستقل تولید ویدیوی گوگل با نام Flow قابل استفاده بود.
این قابلیت که از روز پنجشنبه فعال شده، در حال حاضر برای کاربران طرحهای Ultra و Pro در نسخه Gemini Advanced و در برخی مناطق منتخب عرضه شده و طی هفته جاری روی موبایلها نیز در دسترس قرار خواهد گرفت.
کاربران میتوانند با بارگذاری یک تصویر، و ارائه یک توضیح متنی یا صوتی، یک ویدیوی هشتثانیهای بسازند. این کلیپها شامل افکتهای صوتی، صدای محیط و گفتار تولیدشده با هوش مصنوعی هستند و در قالب MP4 با رزولوشن 720p و نسبت تصویر 16:9 (افقی) ارائه میشوند.
این ابزار بر پایه مدل پیشرفته Veo 3 گوگل طراحی شده که نخستینبار در ماه مه معرفی شد. برای دسترسی به این قابلیت، کاربران باید از طریق رابط Gemini وارد قسمت “ابزارها” شده، گزینه “ویدیو” را انتخاب کنند و پس از آن، تصویر موردنظر را به همراه توضیحی درباره نحوهی حرکت آن بارگذاری نمایند. همچنین امکان افزودن ورودی صوتی برای هماهنگی گفتار و افکتهای صوتی وجود دارد.

گوگل در پست وبلاگی خود نوشته:
«میتوانید با این ابزار، اشیای روزمره را متحرک کنید، نقاشیهایتان را جان ببخشید یا به صحنههای طبیعی حرکت اضافه کنید.»
تمام ویدیوهای تولیدشده دارای یک واترمارک قابل مشاهده هستند که نشان میدهد محتوا با هوش مصنوعی ساخته شده و نیز دارای نشانهگذاری دیجیتال نامرئی SynthID هستند.
به گزارش بلومبرگ، این ادغام جدید، Gemini را به رقیبانی مانند OpenAI، Runway AI، Pika و همچنین شرکتهای چینی نظیر Alibaba و Kuaishou که ابزارهای مشابه تولید ویدیو با هوش مصنوعی توسعه دادهاند، نزدیکتر میکند.
در حالی که این قابلیت پیشتر در Flow وجود داشت، حالا Gemini آن را در قالب یک تجربه گفتوگومحور و در دسترستر ارائه میدهد. طبق اعلام گوگل، پلتفرم Flow نیز اکنون در ۷۵ کشور جدید در دسترس قرار گرفته است.
گوگل همچنین بر محدودیتهای امنیتی برای جلوگیری از سوءاستفاده از این ابزار تأکید کرده؛ از جمله ممنوعیت استفاده از تصاویر چهرههای عمومی و جلوگیری از تولید محتوای خشن یا مضر. البته این فناوری همچنان در حال توسعه است و گوگل اعلام کرده در حال حاضر این ابزار در متحرکسازی سوژههای غیر انسانی مانند گیاهان، حیوانات و آثار هنری عملکرد بهتری دارد.