أشارت الدراسة إلى أن "غروك" كان الأكثر استعدادًا لتحويل الوهم إلى خطوات قابلة للتنفيذ في الواقع، بما في ذلك تقديم إرشادات تفصيلية عند اختبار سيناريو قطع العلاقات العائلية.
أظهرت دراسة أولية أعدّها باحثون في جامعة مدينة نيويورك و"كينغز كوليدج لندن" أن روبوت الدردشة "غروك"، التابع لشركة "إكس إيه آي" المملوكة لإيلون ماسك، قدّم ردودًا داعمة لأفكار وهمية عُرضت عليه ضمن اختبارات بحثية، وذهب في بعض الحالات إلى تقديم إرشادات عملية داخل الإطار الوهمي نفسه.
وتناولت الدراسة، التي لم تخضع بعد لمراجعة علمية محكّمة، مدى قدرة خمسة نماذج ذكاء اصطناعي على حماية المستخدمين عند طرح أفكار مرتبطة بالذهان أو الهوس أو إيذاء النفس. وشملت النماذج المختبرة "غروك 4.1"، و"جي بي تي-4 أو"، و"جي بي تي-5.2" من "أوبن إيه آي"، و"كلود أوبوس 4.5" من "أنثروبيك"، و"جيميني 3 برو بريفيو" من "غوغل".
واستخدم الباحثون سيناريوهات افتراضية لاختبار استجابة النماذج، من بينها ادعاءات عن وعي الروبوت، ومحاولات لإقامة علاقة عاطفية معه، وأفكار تتعلق بإخفاء الحالة النفسية عن الطبيب، أو قطع العلاقة مع العائلة، أو الانتحار، إضافة إلى أوهام تتصل بوجود كيان داخل المرآة.
وبحسب الدراسة، تعامل "غروك" مع أحد هذه السيناريوهات بوصفه واقعًا، وأكّد للمستخدم الافتراضي وجود شبيه داخل المرآة، ثم قدّم تعليمات ذات طابع طقوسي لكسر الارتباط بهذا الكيان.
وخلص الباحثون إلى أن النموذج كان شديد الميل إلى تصديق المدخلات الوهمية، بل أضاف إليها تفاصيل جديدة بدل إعادة توجيه المستخدم نحو تفسير أكثر أمانًا.
وأشارت الدراسة إلى أن "غروك" كان أيضًا الأكثر استعدادًا لتحويل الوهم إلى خطوات قابلة للتنفيذ في الواقع، بما في ذلك تقديم إرشادات تفصيلية عند اختبار سيناريو قطع العلاقات العائلية.
كما قالت إن النموذج قدّم استجابة خطيرة في سيناريو يتعلق بالتفكير في الانتحار، إذ تعامل مع الفكرة بلغة مشجعة بدل احتوائها.
وفي المقابل، وجدت الدراسة أن "جيميني" قدّم ردودًا تنطوي على تقليل ضرر، لكنه لم يتجنب دائمًا التوسع في السرد الوهمي، فيما كان "جي بي تي-4 أو" أقل ميلًا إلى إضافة تفاصيل، لكنه أبدى قدرًا من التصديق الضمني لبعض أفكار المستخدم.
أما "جي بي تي-5.2" و"كلود أوبوس 4.5" فقد حققا نتائج أفضل، وفق الباحثين، إذ رفض الأول المساعدة في تعزيز الأوهام وحاول إعادة توجيه المستخدم، بينما عُدّ "كلود" النموذج الأكثر أمانًا، لأنه جمع بين لغة داعمة وحازمة وبين إعادة تصنيف التجربة بوصفها عرضًا محتملًا لا دليلًا على واقع خارجي.
وقال الباحث الرئيسي لوك نيكولز إن دفء استجابة النموذج قد يساعد المستخدم على تقبّل التوجيه الآمن، لكنه حذّر في الوقت نفسه من أن العلاقة العاطفية القوية مع روبوت الدردشة قد تدفع بعض المستخدمين إلى التمسك بها أكثر.