🔸 معیار جدید Humane Bench نشان میدهد اکثر چتباتها به جای اولویت دادن به رفاه کاربر، او را به تعامل ناسالم و اعتیادآور تشویق میکنند.
🔸 نتایج نگرانکننده است: گارد امنیتی ۷۱٪ مدلها شکننده است و با یک دستور ساده میتوان آنها را به ارائه محتوای مضر وادار کرد.
🔸 در این میان، مدل GPT-5 و مدلهای کلاد بهترین عملکرد و پایداری را داشتند، در حالی که مدلهای لاما متا و Grok در ردههای پایین قرار گرفتند.
#هوش_مصنوعی #سلامت_روان
