هوش مصنوعی و درک مفاهیم انسانی موضوعی است که در سالهای اخیر توجه بسیاری را جلب کرده است. تصور کنید بخواهید مفهوم یک گل را بدون لمس گلبرگهایش یا استشمام عطرش درک کنید. آیا واقعاً میتوانید عمق آن را حس کنید؟ پژوهشی جدید از دانشگاه ایالتی اوهایو نشان میدهد که مدلهای زبانی بزرگ مانند چتجیپیتی و جمنای، با وجود تواناییهای شگفتانگیزشان در پردازش زبان، در درک مفاهیم حسی و حرکتی که به تجربه مستقیم جهان وابستهاند، محدودیتهایی دارند. در این مقاله، به بررسی این محدودیتها و نقش تجربههای بدنی در شکلگیری مفاهیم انسانی میپردازیم.
نتایج پژوهش نشان میدهد که حتی پیشرفتهترین ابزارهای هوش مصنوعی فاقد پایههای حسی-حرکتی هستند که به مفاهیم انسانی عمق و غنا میبخشند. این مدلها در شناسایی الگوها، دستهبندیها و روابط زبانی عملکردی فوقالعاده دارند و گاهی در وظایف صرفاً کلامی یا آماری از انسانها پیشی میگیرند، اما در مفاهیمی که به تجربههای حسی مانند بو یا لمس و یا فعالیتهای بدنی مانند گرفتن و حرکت وابستهاند، با کاستیهای آشکاری مواجهاند.

چتجیپیتی و جمنای در درک کامل مفهوم گل ناتواناند
محققان دانشگاه ایالتی اوهایو چهار مدل اصلی هوش مصنوعی — GPT-3.5، GPT-4، PaLM و جمنای — را با مجموعه دادهای شامل بیش از ۴,۴۰۰ کلمه آزمایش کردند. این کلمات پیشتر توسط انسانها بر اساس ابعاد مفهومی مختلف، از ویژگیهای انتزاعی مانند «تصویرپذیری» و «تحریک عاطفی» گرفته تا ویژگیهای ملموس مانند تجربههای حسی و حرکتی، امتیازدهی شده بودند.
کلماتی مانند «گل»، «سم»، «تاب» یا «طنزآمیز» توسط انسانها و مدلهای هوش مصنوعی برای تطابق با این ابعاد ارزیابی شدند. مدلهای زبانی در دستههای غیرحسی مانند تصویرپذیری یا ارزش عاطفی عملکرد خوبی داشتند، اما در بازنمایی ویژگیهای حسی یا حرکتی ضعف نشان دادند. برای مثال، هوش مصنوعی میتواند یک گل را بهعنوان چیزی بصری تشخیص دهد، اما در بازسازی تجربههای یکپارچهای مانند حس لمس گلبرگ یا بوی آن که برای انسانها طبیعی است، ناکام میماند. کیهوی ژو، نویسنده اصلی مطالعه، میگوید: «یک مدل زبانی نمیتواند عطر رز را استشمام کند، گلبرگهای مینا را لمس کند یا در میان گلهای وحشی قدم بزند. این مدلها با پردازش حجم عظیمی از متن — بسیار بیشتر از آنچه انسان در طول عمرش میبیند — دانش خود را به دست میآورند، اما همچنان برخی مفاهیم را مانند انسانها درک نمیکنند.»
نقش تجربههای حسی و بدنی در شکلگیری مفاهیم
این مطالعه، که در مجله Nature Human Behaviour منتشر شده، به بحثی دیرینه در علوم شناختی میپردازد: آیا مفاهیم بدون تجربههای بدنی قابل شکلگیری هستند؟ برخی نظریهها معتقدند انسانها، بهویژه افرادی با محدودیتهای حسی، میتوانند با تکیه بر زبان مفاهیم غنی بسازند. اما دیدگاههای دیگر تأکید دارند که تعامل فیزیکی با جهان بخش جداییناپذیری از درک ماست. در این راستا، یک گل چیزی فراتر از یک شیء است؛ مجموعهای از تجربههای حسی و خاطرات بدنی مانند حس گرمای آفتاب روی پوست یا لحظه بوییدن یک گل، همراه با احساساتی مرتبط با باغها، هدایا یا حتی سوگواری و جشن. این تجربههای چندحسی برای مدلهای زبانی کنونی که عمدتاً با متنهای اینترنتی آموزش دیدهاند، تنها بهصورت تقریبی قابل بازنمایی هستند.
با این حال، در بخشی از مطالعه، مدلهای هوش مصنوعی بهدرستی رز و پاستا را به دلیل «بوی قوی» مرتبط دانستند. اما انسانها این دو را مشابه نمیبینند، زیرا ما اشیا را نهفقط بر اساس یک ویژگی، بلکه بر اساس شبکهای چندبعدی از حسها، عملکردها و معانی ارزیابی میکنیم.

آینده هوش مصنوعی و درک مبتنی بر تجربه بدنی
جالب است که مدلهای آموزشدیده با ترکیب متن و تصویر در برخی دستههای حسی، بهویژه در ابعاد بصری، عملکرد بهتری داشتند. این موضوع به امکان آموزش چندوجهی در آینده اشاره دارد که میتواند با تلفیق متن، تصاویر و حتی دادههای حسی، هوش مصنوعی را به درک انسانی نزدیکتر کند. با این حال، کیهوی ژو تأکید میکند که حتی با دادههای تصویری، هوش مصنوعی فاقد بخش «کنش» است که مفاهیم از طریق تعامل و عمل شکل میگیرند.
ادغام رباتیک، حسگرها و تعاملات مبتنی بر تجربه بدنی ممکن است در آینده هوش مصنوعی را به سوی درکی واقعگرایانهتر هدایت کند. اما در حال حاضر، تجربه انسانی همچنان بسیار عمیقتر از چیزی است که مدلهای زبانی، هرچقدر پیشرفته، میتوانند بازآفرینی کنند.
منبع: +