هوش مصنوعی و درک مفاهیم انسانی

چرا هوش مصنوعی نمی‌تواند گل‌ها را مانند انسان‌ درک کند

هوش مصنوعی و درک مفاهیم انسانی موضوعی است که در سال‌های اخیر توجه بسیاری را جلب کرده است. تصور کنید بخواهید مفهوم یک گل را بدون لمس گلبرگ‌هایش یا استشمام عطرش درک کنید. آیا واقعاً می‌توانید عمق آن را حس کنید؟ پژوهشی جدید از دانشگاه ایالتی اوهایو نشان می‌دهد که مدل‌های زبانی بزرگ مانند چت‌جی‌پی‌تی و جمنای، با وجود توانایی‌های شگفت‌انگیزشان در پردازش زبان، در درک مفاهیم حسی و حرکتی که به تجربه مستقیم جهان وابسته‌اند، محدودیت‌هایی دارند. در این مقاله، به بررسی این محدودیت‌ها و نقش تجربه‌های بدنی در شکل‌گیری مفاهیم انسانی می‌پردازیم.

نتایج پژوهش نشان می‌دهد که حتی پیشرفته‌ترین ابزارهای هوش مصنوعی فاقد پایه‌های حسی-حرکتی هستند که به مفاهیم انسانی عمق و غنا می‌بخشند. این مدل‌ها در شناسایی الگوها، دسته‌بندی‌ها و روابط زبانی عملکردی فوق‌العاده دارند و گاهی در وظایف صرفاً کلامی یا آماری از انسان‌ها پیشی می‌گیرند، اما در مفاهیمی که به تجربه‌های حسی مانند بو یا لمس و یا فعالیت‌های بدنی مانند گرفتن و حرکت وابسته‌اند، با کاستی‌های آشکاری مواجه‌اند.

چت‌جی‌پی‌تی و جمنای در درک کامل مفهوم گل ناتوان‌اند

محققان دانشگاه ایالتی اوهایو چهار مدل اصلی هوش مصنوعی — GPT-3.5، GPT-4، PaLM و جمنای — را با مجموعه داده‌ای شامل بیش از ۴,۴۰۰ کلمه آزمایش کردند. این کلمات پیش‌تر توسط انسان‌ها بر اساس ابعاد مفهومی مختلف، از ویژگی‌های انتزاعی مانند «تصویرپذیری» و «تحریک عاطفی» گرفته تا ویژگی‌های ملموس مانند تجربه‌های حسی و حرکتی، امتیازدهی شده بودند.

کلماتی مانند «گل»، «سم»، «تاب» یا «طنزآمیز» توسط انسان‌ها و مدل‌های هوش مصنوعی برای تطابق با این ابعاد ارزیابی شدند. مدل‌های زبانی در دسته‌های غیرحسی مانند تصویرپذیری یا ارزش عاطفی عملکرد خوبی داشتند، اما در بازنمایی ویژگی‌های حسی یا حرکتی ضعف نشان دادند. برای مثال، هوش مصنوعی می‌تواند یک گل را به‌عنوان چیزی بصری تشخیص دهد، اما در بازسازی تجربه‌های یکپارچه‌ای مانند حس لمس گلبرگ یا بوی آن که برای انسان‌ها طبیعی است، ناکام می‌ماند. کیهوی ژو، نویسنده اصلی مطالعه، می‌گوید: «یک مدل زبانی نمی‌تواند عطر رز را استشمام کند، گلبرگ‌های مینا را لمس کند یا در میان گل‌های وحشی قدم بزند. این مدل‌ها با پردازش حجم عظیمی از متن — بسیار بیشتر از آنچه انسان در طول عمرش می‌بیند — دانش خود را به دست می‌آورند، اما همچنان برخی مفاهیم را مانند انسان‌ها درک نمی‌کنند.»

نقش تجربه‌های حسی و بدنی در شکل‌گیری مفاهیم

این مطالعه، که در مجله Nature Human Behaviour منتشر شده، به بحثی دیرینه در علوم شناختی می‌پردازد: آیا مفاهیم بدون تجربه‌های بدنی قابل شکل‌گیری هستند؟ برخی نظریه‌ها معتقدند انسان‌ها، به‌ویژه افرادی با محدودیت‌های حسی، می‌توانند با تکیه بر زبان مفاهیم غنی بسازند. اما دیدگاه‌های دیگر تأکید دارند که تعامل فیزیکی با جهان بخش جدایی‌ناپذیری از درک ماست. در این راستا، یک گل چیزی فراتر از یک شیء است؛ مجموعه‌ای از تجربه‌های حسی و خاطرات بدنی مانند حس گرمای آفتاب روی پوست یا لحظه بوییدن یک گل، همراه با احساساتی مرتبط با باغ‌ها، هدایا یا حتی سوگواری و جشن. این تجربه‌های چندحسی برای مدل‌های زبانی کنونی که عمدتاً با متن‌های اینترنتی آموزش دیده‌اند، تنها به‌صورت تقریبی قابل بازنمایی هستند.

با این حال، در بخشی از مطالعه، مدل‌های هوش مصنوعی به‌درستی رز و پاستا را به دلیل «بوی قوی» مرتبط دانستند. اما انسان‌ها این دو را مشابه نمی‌بینند، زیرا ما اشیا را نه‌فقط بر اساس یک ویژگی، بلکه بر اساس شبکه‌ای چندبعدی از حس‌ها، عملکردها و معانی ارزیابی می‌کنیم.

آینده هوش مصنوعی و درک مبتنی بر تجربه بدنی

جالب است که مدل‌های آموزش‌دیده با ترکیب متن و تصویر در برخی دسته‌های حسی، به‌ویژه در ابعاد بصری، عملکرد بهتری داشتند. این موضوع به امکان آموزش چندوجهی در آینده اشاره دارد که می‌تواند با تلفیق متن، تصاویر و حتی داده‌های حسی، هوش مصنوعی را به درک انسانی نزدیک‌تر کند. با این حال، کیهوی ژو تأکید می‌کند که حتی با داده‌های تصویری، هوش مصنوعی فاقد بخش «کنش» است که مفاهیم از طریق تعامل و عمل شکل می‌گیرند.

ادغام رباتیک، حسگرها و تعاملات مبتنی بر تجربه بدنی ممکن است در آینده هوش مصنوعی را به سوی درکی واقع‌گرایانه‌تر هدایت کند. اما در حال حاضر، تجربه انسانی همچنان بسیار عمیق‌تر از چیزی است که مدل‌های زبانی، هرچقدر پیشرفته، می‌توانند بازآفرینی کنند.

منبع: +