·21 تیر 1404·0

قابلیت جدید Gemini گوگل: تبدیل عکس به ویدیو با کمک هوش مصنوعی

گوگل از قابلیت جدیدی در دستیار هوش مصنوعی خود، Gemini رونمایی کرده که به کاربران امکان می‌دهد تصاویر خود را به کلیپ‌های ویدیویی کوتاه تبدیل کنند—ابزاری که پیش‌تر فقط از طریق پلتفرم مستقل تولید ویدیوی گوگل با نام Flow قابل استفاده بود.

این قابلیت که از روز پنجشنبه فعال شده، در حال حاضر برای کاربران طرح‌های Ultra و Pro در نسخه Gemini Advanced و در برخی مناطق منتخب عرضه شده و طی هفته جاری روی موبایل‌ها نیز در دسترس قرار خواهد گرفت.

کاربران می‌توانند با بارگذاری یک تصویر، و ارائه یک توضیح متنی یا صوتی، یک ویدیوی هشت‌ثانیه‌ای بسازند. این کلیپ‌ها شامل افکت‌های صوتی، صدای محیط و گفتار تولیدشده با هوش مصنوعی هستند و در قالب MP4 با رزولوشن 720p و نسبت تصویر 16:9 (افقی) ارائه می‌شوند.

این ابزار بر پایه مدل پیشرفته Veo 3 گوگل طراحی شده که نخستین‌بار در ماه مه معرفی شد. برای دسترسی به این قابلیت، کاربران باید از طریق رابط Gemini وارد قسمت “ابزارها” شده، گزینه “ویدیو” را انتخاب کنند و پس از آن، تصویر موردنظر را به همراه توضیحی درباره نحوه‌ی حرکت آن بارگذاری نمایند. همچنین امکان افزودن ورودی صوتی برای هماهنگی گفتار و افکت‌های صوتی وجود دارد.

گوگل در پست وبلاگی خود نوشته:

«می‌توانید با این ابزار، اشیای روزمره را متحرک کنید، نقاشی‌هایتان را جان ببخشید یا به صحنه‌های طبیعی حرکت اضافه کنید.»

تمام ویدیوهای تولیدشده دارای یک واترمارک قابل مشاهده هستند که نشان می‌دهد محتوا با هوش مصنوعی ساخته شده و نیز دارای نشانه‌گذاری دیجیتال نامرئی SynthID هستند.

به گزارش بلومبرگ، این ادغام جدید، Gemini را به رقیبانی مانند OpenAI، Runway AI، Pika و همچنین شرکت‌های چینی نظیر Alibaba و Kuaishou که ابزارهای مشابه تولید ویدیو با هوش مصنوعی توسعه داده‌اند، نزدیک‌تر می‌کند.

در حالی که این قابلیت پیش‌تر در Flow وجود داشت، حالا Gemini آن را در قالب یک تجربه گفت‌وگومحور و در دسترس‌تر ارائه می‌دهد. طبق اعلام گوگل، پلتفرم Flow نیز اکنون در ۷۵ کشور جدید در دسترس قرار گرفته است.

گوگل همچنین بر محدودیت‌های امنیتی برای جلوگیری از سوءاستفاده از این ابزار تأکید کرده؛ از جمله ممنوعیت استفاده از تصاویر چهره‌های عمومی و جلوگیری از تولید محتوای خشن یا مضر. البته این فناوری همچنان در حال توسعه است و گوگل اعلام کرده در حال حاضر این ابزار در متحرک‌سازی سوژه‌های غیر انسانی مانند گیاهان، حیوانات و آثار هنری عملکرد بهتری دارد.