آزمون جدید اوپن‌ای‌آی: هوش مصنوعی در نیمی از مشاغل به سطح انسان رسید

🔸 اوپن‌ای‌آی در آزمون جدید GDPval نشان داد مدل Claude Opus 4.1 در ۴۹٪ و GPT-5 در ۴۰٪ از وظایف تخصصی، هم‌سطح یا بهتر از انسان‌ها عمل می‌کنند. این یک جهش بزرگ نسبت به امتیاز ۱۳٪ مدل قبلی GPT-4o است.

🔸 این آزمون که عملکرد AI را در کارهای اقتصادی واقعی می‌سنجد، فعلاً محدود است اما به گفته اوپن‌ای‌آی، پیشرفت سریع مدل‌ها نشان می‌دهد AI به زودی می‌تواند بخشی از کارهای تخصصی را برای انسان‌ها انجام دهد.

#هوش_مصنوعی #اوپن‌ای‌آی #آینده_مشاغل

telegram
youtube