🔸 غولهای AI شامل OpenAI، دیپمایند و Anthropic، روش «زنجیره تفکر» (CoT) را برای نظارت بر استدلال داخلی مدلها و افزایش ایمنی پیشنهاد دادهاند.
🔸 این روش با شفافسازی «جعبه سیاه» AI، به شناسایی نیتهای مخرب مثل فریب کاربر یا دور زدن قوانین پیش از وقوع کمک میکند.
🔸 محققان هشدار میدهند این قابلیت شکننده است و ممکن است با پیشرفت AI از بین برود. آنها بر مطالعه فوری برای حفظ این فرصت نظارتی تاکید دارند.
#هوش_مصنوعی #ایمنی_AI
