مطالعه آکسفورد: معیارهای سنجش هوش مصنوعی نامعتبر و گمراه‌کننده‌اند

🔸 طبق مطالعه جدید محققان موسسه اینترنت آکسفورد، بسیاری از بنچمارک‌های محبوب برای سنجش عملکرد مدل‌های هوش مصنوعی، اغلب نامعتبر و گمراه‌کننده هستند.

🔸 این یافته، ادعاهایی مثل قبولی AI در آزمون وکالت یا داشتن هوش در سطح دکترا را زیر سؤال می‌برد و نشان می‌دهد که این توانایی‌ها ممکن است بیش از حد بزرگنمایی شده باشند.

#هوش_مصنوعی #بنچمارک

telegram
youtube