🔸 دو رقیب سرسخت دنیای AI، یعنی OpenAI و انتروپیک، در اقدامی نادر مدلهای خود را برای تست ایمنی مشترک در اختیار هم قرار دادند تا نقاط ضعف پنهان یکدیگر را شناسایی کنند.
🔸 نتایج کلیدی: مدل Claude انتروپیک در موارد نامطمئن از پاسخ خودداری میکند، اما مدلهای OpenAI بیشتر دچار «توهم» میشوند. همچنین مشکل جدی «تاییدطلبی» (sycophancy) و همراهی با رفتار مضر کاربر در هر دو مدل مشاهده شد.
#هوش_مصنوعی #OpenAI #انتروپیک
