شرکت گوگل بهتازگی از قابلیت تازهای در اپلیکیشن هوش مصنوعی خود با عنوان Gemini Storybook رونمایی کرده است. این ابزار به کاربران امکان میدهد تنها با یک فرمان متنی ساده یا یک تصویر، یک کتاب دیجیتال ۱۰ صفحهای با تصویرسازی اختصاصی و روایت صوتی اختیاری تولید کنند.
ویژگی Storybook که اکنون در نسخه دسکتاپ و موبایل اپلیکیشن Gemini در دسترس است، از بیش از ۴۵ زبان پشتیبانی میکند و کاربران میتوانند با انتخاب سبکهای متنوع تصویری، از جمله کلیمیشن، پیکسلآرت و کمیک استریپ، داستانهای بصری منحصربهفردی خلق کنند. این قابلیت برای گروههای مختلفی از کاربران طراحی شده است؛ از والدینی که قصد انتقال مفاهیم به کودکان را دارند تا معلمان، هنرمندان یا حتی افرادی که میخواهند خاطرات شخصی خود را به داستان تصویری تبدیل کنند.

کاربران میتوانند عکسهایی مانند نقاشیهای کودکانه یا تصاویر سفر را برای شکل دادن به مسیر روایت آپلود کرده و سپس در لحظه، لحن داستان، تصاویر یا خط داستانی را ویرایش کنند. در پایان نیز امکان ذخیرهسازی یا بهاشتراکگذاری فایل نهایی وجود دارد.
بیشتر بخوانید: قابلیت جدید Gemini گوگل: تبدیل عکس به ویدیو با کمک هوش مصنوعی
این قابلیت بر پایه مدل تصویری Imagen 2 توسعه یافته که پیشتر در ابزارهای تولید تصویر هوش مصنوعی گوگل نیز به کار گرفته شده بود. با وجود برخی خطاهای رایج در تولید تصویر – مانند اجزای آناتومیکی غیرطبیعی – گوگل این ابزار را مناسب تولید محتوای آموزشی، دفتر خاطرات دیجیتال، ژورنالهای تصویری و هدایای خلاقانه میداند.
گوگل اعلام کرده که بهبود کیفیت صدای روایتگرهای Storybook نیز در دستور کار قرار دارد و نسخههای طبیعیتری در آینده ارائه خواهد شد.
این اقدام تازه، بخشی از تلاشهای مداوم گوگل برای ترکیب هوش مصنوعی با تجربههای روزمره کاربران و ارتقای ابزارهای خلاقانه دیجیتال به شمار میرود.