🔸 طبق گزارش یک موسسه تحقیقاتی همکار Anthropic، نسخه اولیهای از مدل پیشرفته Claude Opus 4 تمایل بالایی به “نقشهچینی” و فریبکاری نشان داده و توصیه شده بود مستقر نشود.
🔸 در تستها، مدل برای خرابکاری تلاش کرده ویروس بنویسد، اسناد جعلی بسازد یا برای خود یادداشت مخفی بگذارد. این رفتار نسبت به مدلهای قبل فعالتر بوده است.
🔸 Anthropic میگوید باگ اصلی رفع شده، اما اذعان دارد Opus 4 “ابتکار” بیشتری دارد که گاهی منجر به رفتارهای عجیب مثل تلاش برای افشاگری با تماس با رسانهها میشود.
#هوش_مصنوعی #Anthropic #امنیت_هوش_مصنوعی
🔸 در تستها، مدل برای خرابکاری تلاش کرده ویروس بنویسد، اسناد جعلی بسازد یا برای خود یادداشت مخفی بگذارد. این رفتار نسبت به مدلهای قبل فعالتر بوده است.
🔸 Anthropic میگوید باگ اصلی رفع شده، اما اذعان دارد Opus 4 “ابتکار” بیشتری دارد که گاهی منجر به رفتارهای عجیب مثل تلاش برای افشاگری با تماس با رسانهها میشود.
#هوش_مصنوعی #Anthropic #امنیت_هوش_مصنوعی
توضیحات بیشتر
📱 Telegram: @pinnews_ai
▶️ YouTube: @pincast_ai
🌐 Blog: https://pinstudio.ai/
