🔸 طبق مطالعه جدید محققان موسسه اینترنت آکسفورد، بسیاری از بنچمارکهای محبوب برای سنجش عملکرد مدلهای هوش مصنوعی، اغلب نامعتبر و گمراهکننده هستند.
🔸 این یافته، ادعاهایی مثل قبولی AI در آزمون وکالت یا داشتن هوش در سطح دکترا را زیر سؤال میبرد و نشان میدهد که این تواناییها ممکن است بیش از حد بزرگنمایی شده باشند.
#هوش_مصنوعی #بنچمارک
