هوش مصنوعی در آزمون تمرکز انسان مردود شد

یک آزمایش معروف روانشناسی که دهههاست برای سنجش تمرکز انسان استفاده میشود، نشان داده است که پیشرفتهترین سامانههای هوش مصنوعی در حفظ تمرکز برای مدت طولانی با مشکل روبهرو میشوند. این یافته ضعف پنهان هوش مصنوعی را آشکار میکند.
جهان صنعت نیوز، یک آزمایش معروف روانشناسی، ضعف شگفتانگیزی را در برخی از پیشرفتهترین سامانههای هوش مصنوعی امروزی آشکار کرده است. این یافته نشان میدهد که نحوه توجه و تمرکز در هوش مصنوعی ممکن است با انسان تفاوت اساسی داشته باشد.
پژوهشگران به سرپرستی سوکتو پاتل (Suketu Patel) بررسی کردند که سامانههای هوش مصنوعی پیشرفته (مانند جیپیتی ۵، کلود و جمینای) چگونه یک چالش شناختی معروف به تکلیف استروپ (Stroop task) را مدیریت میکنند. نتایج نشان میدهد که هوش مصنوعی در بسیاری از کارهای پیچیده عملکرد چشمگیری دارد، اما در حفظ تمرکز در برابر اطلاعات متضاد و برای مدت طولانی، دچار مشکل میشود.
تکلیف استروپ چیست؟
تکلیف استروپ یک آزمایش معروف روانشناسی است که از چندین دهه پیش، برای مطالعه توجه و کنترل ذهنی استفاده میشود. در این آزمایش، اسامی رنگها (مانند قرمز یا آبی) به شرکتکنندگان نشان داده میشود، اما این کلمات با جوهر رنگی نوشته شدهاند.
گاهی رنگ جوهر با معنای کلمه همخوانی دارد (مثلاً کلمه قرمز با جوهر قرمز نوشته میشود) و گاهی متضاد است (مثلاً کلمه قرمز با جوهر آبی نوشته میشود). از شرکتکنندگان خواسته میشود رنگ جوهر را تشخیص دهند و معنای کلمه را نادیده بگیرند.
این کار ساده به نظر میرسد، اما یک تضاد در ذهن ایجاد میکند چون مغز هم باید رنگ را ببیند و هم کلمه را نادیده بگیرد. بیشتر مردم در خواندن کلمات بسیار ماهر هستند؛ بنابراین سرکوب این عادت نیازمند چیزی است که روانشناسان کنترل اجرایی مینامند که به معنای توانایی مغز برای تمرکز بر یک هدف، مقاومت در برابر حواسپرتی و غلبه بر واکنشهای خودکار است.
انسانها معمولاً وقتی رنگ جوهر با نام رنگ همخوانی ندارد، کمی دیرتر پاسخ میدهند؛ اما حتی اگر آزمایش طولانی شود، باز هم دقتشان بالاست و تمرکز خود را روی دستورالعمل حفظ میکنند.
عملکرد خوب هوش مصنوعی در ابتدا
پژوهشگران برای بررسی عملکرد سامانههای هوش مصنوعی، چند مدل پیشرو را با فهرستی از کلمات رنگی آزمایش کردند. وقتی فهرستها کوتاه بودند (مثلاً فقط پنج کلمه)، مدلها عملکرد شگفتانگیزی داشتند.
دقت جیپیتی ۴ او، در این آزمونهای کوتاه به ۹۱ درصد رسید. کلود ۳.۵ سونت نیز نتیجه خوبی گرفت. در نگاه اول، به نظر میرسید که سامانههای هوش مصنوعی میتوانند به خوبی از دستورالعمل پیروی کنند و معنای مزاحم کلمات را نادیده بگیرند.
افت عملکرد با افزایش طول فهرست
اما زمانی که پژوهشگران طول فهرست کلمات را افزایش دادند، وضعیت به طرز چشمگیری تغییر کرد. دقت جیپیتی ۴ او، از ۹۱ درصد با پنج کلمه به ۵۷ درصد با ۱۰ کلمه کاهش یافت. زمانی که فهرست به ۴۰ کلمه رسید، دقت به ۱۵ درصد سقوط کرد.
کلود ۳.۵ سونت مقاومت بیشتری نشان داد و تا ۲۰ کلمه عملکرد پایداری داشت، اما با ۴۰ کلمه دقت آن به ۲۴ درصد کاهش یافت. پژوهشگران الگوهای مشابهی را در جیپیتی ۵، کلود اپوس ۴.۱ و جمینای ۲.۵ مشاهده کردند.
عملکرد زمانی بدتر شد که کلمات همخوان و ناهمخوان با رنگها در یک فهرست ترکیب شدند. در آن شرایط، دقت روی موارد ناهمخوان تقریباً به صفر رسید.
چرا انسان و هوش مصنوعی متفاوت پاسخ میدهند؟
این نتایج نشان میدهد که نحوه پردازش اطلاعات در هوش مصنوعی با شناخت انسان تفاوت مهمی دارد. سامانههای هوش مصنوعی، درست مثل انسانها، در طول آموزش خود بیشتر با کلمات سروکار داشتهاند تا با رنگها؛ به همین دلیل، تمایل طبیعی دارند که به کلمه نوشته شده توجه کنند.
اما انسانها معمولاً میتوانند این واکنش خودکار را سرکوب کنند و روی کاری که از آنها خواسته شده متمرکز بمانند؛ حتی اگر آزمایش طولانی شود. در مقابل، مدلهای هوش مصنوعی با ادامه آزمایش، کمکم به خواندن کلمات بازمیگشتند و رنگ را نادیده میگرفتند، یعنی به نظر میرسید هدف اصلی را فراموش کردهاند.
به گفته پژوهشگران، این شکست نشان میدهد که سازوکار توجه در سامانههای هوش مصنوعی امروزی، اساساً با سامانه توجه در مغز انسان تفاوت دارد.
نگاهی به محدودیتهای هوش مصنوعی
مدلهای پیشرفته هوش مصنوعی تواناییهای چشمگیری در نوشتن، استدلال، برنامهنویسی و گفتوگو دارند؛ اما مطالعاتی مانند این نشان میدهد که عملکرد خوب لزوماً به معنای پردازش اطلاعات به شیوه انسان نیست.
این یافتهها حکایت از آن دارد که هوش مصنوعی امروزی ممکن است نقاط ضعف پنهانی داشته باشد؛ بهویژه در کارهایی که نیاز به تمرکز پایدار، مهار واکنشهای خودکار و پیروی طولانیمدت از دستورالعملهای خاص دارند.
با توجه به اینکه سامانههای هوش مصنوعی به طور فزایندهای در زندگی روزمره ما وارد میشوند، درک این محدودیتها به همان اندازه شناخت نقاط قوت آنها اهمیت دارد.
منبع: ایسنا
دانش و فناوریلینک کوتاه :
