🔸 اوپنایآی در آزمون جدید GDPval نشان داد مدل Claude Opus 4.1 در ۴۹٪ و GPT-5 در ۴۰٪ از وظایف تخصصی، همسطح یا بهتر از انسانها عمل میکنند. این یک جهش بزرگ نسبت به امتیاز ۱۳٪ مدل قبلی GPT-4o است.
🔸 این آزمون که عملکرد AI را در کارهای اقتصادی واقعی میسنجد، فعلاً محدود است اما به گفته اوپنایآی، پیشرفت سریع مدلها نشان میدهد AI به زودی میتواند بخشی از کارهای تخصصی را برای انسانها انجام دهد.
#هوش_مصنوعی #اوپنایآی #آینده_مشاغل
