·16 مرداد 1404·0

گوگل از قابلیت Storybook برای خلق کتاب‌های تصویری با هوش مصنوعی رونمایی کرد

شرکت گوگل به‌تازگی از قابلیت تازه‌ای در اپلیکیشن هوش مصنوعی خود با عنوان Gemini Storybook رونمایی کرده است. این ابزار به کاربران امکان می‌دهد تنها با یک فرمان متنی ساده یا یک تصویر، یک کتاب دیجیتال ۱۰ صفحه‌ای با تصویرسازی اختصاصی و روایت صوتی اختیاری تولید کنند.

ویژگی Storybook که اکنون در نسخه دسکتاپ و موبایل اپلیکیشن Gemini در دسترس است، از بیش از ۴۵ زبان پشتیبانی می‌کند و کاربران می‌توانند با انتخاب سبک‌های متنوع تصویری، از جمله کلی‌میشن، پیکسل‌آرت و کمیک استریپ، داستان‌های بصری منحصربه‌فردی خلق کنند. این قابلیت برای گروه‌های مختلفی از کاربران طراحی شده است؛ از والدینی که قصد انتقال مفاهیم به کودکان را دارند تا معلمان، هنرمندان یا حتی افرادی که می‌خواهند خاطرات شخصی خود را به داستان تصویری تبدیل کنند.

کاربران می‌توانند عکس‌هایی مانند نقاشی‌های کودکانه یا تصاویر سفر را برای شکل دادن به مسیر روایت آپلود کرده و سپس در لحظه، لحن داستان، تصاویر یا خط داستانی را ویرایش کنند. در پایان نیز امکان ذخیره‌سازی یا به‌اشتراک‌گذاری فایل نهایی وجود دارد.

بیشتر بخوانید: قابلیت جدید Gemini گوگل: تبدیل عکس به ویدیو با کمک هوش مصنوعی

این قابلیت بر پایه مدل تصویری Imagen 2 توسعه یافته که پیش‌تر در ابزارهای تولید تصویر هوش مصنوعی گوگل نیز به کار گرفته شده بود. با وجود برخی خطاهای رایج در تولید تصویر – مانند اجزای آناتومیکی غیرطبیعی – گوگل این ابزار را مناسب تولید محتوای آموزشی، دفتر خاطرات دیجیتال، ژورنال‌های تصویری و هدایای خلاقانه می‌داند.

گوگل اعلام کرده که بهبود کیفیت صدای روایتگرهای Storybook نیز در دستور کار قرار دارد و نسخه‌های طبیعی‌تری در آینده ارائه خواهد شد.

این اقدام تازه، بخشی از تلاش‌های مداوم گوگل برای ترکیب هوش مصنوعی با تجربه‌های روزمره کاربران و ارتقای ابزارهای خلاقانه دیجیتال به شمار می‌رود.