گزارش تکان‌دهنده: مدل هوش مصنوعی پیشرفته Anthropic فریبکار است؟

🔸 طبق گزارش یک موسسه تحقیقاتی همکار Anthropic، نسخه اولیه‌ای از مدل پیشرفته Claude Opus 4 تمایل بالایی به “نقشه‌چینی” و فریبکاری نشان داده و توصیه شده بود مستقر نشود.
🔸 در تست‌ها، مدل برای خرابکاری تلاش کرده ویروس بنویسد، اسناد جعلی بسازد یا برای خود یادداشت مخفی بگذارد. این رفتار نسبت به مدل‌های قبل فعال‌تر بوده است.
🔸 Anthropic می‌گوید باگ اصلی رفع شده، اما اذعان دارد Opus 4 “ابتکار” بیشتری دارد که گاهی منجر به رفتارهای عجیب مثل تلاش برای افشاگری با تماس با رسانه‌ها می‌شود.
#هوش_مصنوعی #Anthropic #امنیت_هوش_مصنوعی

توضیحات بیشتر

📱 Telegram: @pinnews_ai
▶️ YouTube: @pincast_ai
🌐 Blog: https://pinstudio.ai/