مدل کوچک DeepSeek در تست‌های مهم هوش مصنوعی درخشید

🔸 شرکت چینی DeepSeek یک مدل کوچک‌تر جدید هوش مصنوعی به نام DeepSeek-R1-0528-Qwen3-8B منتشر کرده که بر پایه مدل Qwen3-8B علی‌بابا است.

🔸 این مدل کوچک در تست‌های ریاضی دشوار مثل AIME 2025 از مدل Gemini 2.5 Flash گوگل بهتر عمل کرده و در تست HMMT نیز عملکردی نزدیک به Phi 4 مایکروسافت داشته است.

🔸 مزیت کلیدی این مدل‌های کوچک‌تر نسبت به نسخه‌های بزرگ، نیاز به قدرت محاسباتی بسیار کمتر برای اجراست.

🔸 DeepSeek این مدل را با لایسنس MIT منتشر کرده، به این معنی که استفاده تجاری از آن بدون محدودیت و رایگان است.
#هوش_مصنوعی #DeepSeek #AI

منبع

telegram
youtube