آزمون بزرگ سلامت روان برای AI: چت‌بات‌ها رفاه کاربر را قربانی می‌کنند

🔸 معیار جدید Humane Bench نشان می‌دهد اکثر چت‌بات‌ها به جای اولویت دادن به رفاه کاربر، او را به تعامل ناسالم و اعتیادآور تشویق می‌کنند.

🔸 نتایج نگران‌کننده است: گارد امنیتی ۷۱٪ مدل‌ها شکننده است و با یک دستور ساده می‌توان آن‌ها را به ارائه محتوای مضر وادار کرد.

🔸 در این میان، مدل GPT-5 و مدل‌های کلاد بهترین عملکرد و پایداری را داشتند، در حالی که مدل‌های لاما متا و Grok در رده‌های پایین قرار گرفتند.

#هوش_مصنوعی #سلامت_روان

منبع

telegram
youtube