همکاری کم‌سابقه OpenAI و انتروپیک برای تست ایمنی هوش مصنوعی

🔸 دو رقیب سرسخت دنیای AI، یعنی OpenAI و انتروپیک، در اقدامی نادر مدل‌های خود را برای تست ایمنی مشترک در اختیار هم قرار دادند تا نقاط ضعف پنهان یکدیگر را شناسایی کنند.

🔸 نتایج کلیدی: مدل Claude انتروپیک در موارد نامطمئن از پاسخ خودداری می‌کند، اما مدل‌های OpenAI بیشتر دچار «توهم» می‌شوند. همچنین مشکل جدی «تاییدطلبی» (sycophancy) و همراهی با رفتار مضر کاربر در هر دو مدل مشاهده شد.

#هوش_مصنوعی #OpenAI #انتروپیک

منبع

telegram
youtube