نظارت بر «افکار» هوش مصنوعی: راهکار مشترک OpenAI و گوگل

🔸 غول‌های AI شامل OpenAI، دیپ‌مایند و Anthropic، روش «زنجیره تفکر» (CoT) را برای نظارت بر استدلال داخلی مدل‌ها و افزایش ایمنی پیشنهاد داده‌اند.

🔸 این روش با شفاف‌سازی «جعبه سیاه» AI، به شناسایی نیت‌های مخرب مثل فریب کاربر یا دور زدن قوانین پیش از وقوع کمک می‌کند.

🔸 محققان هشدار می‌دهند این قابلیت شکننده است و ممکن است با پیشرفت AI از بین برود. آنها بر مطالعه فوری برای حفظ این فرصت نظارتی تاکید دارند.

#هوش_مصنوعی #ایمنی_AI

منبع

telegram
youtube