🔸 شرکت چینی DeepSeek یک مدل کوچکتر جدید هوش مصنوعی به نام DeepSeek-R1-0528-Qwen3-8B منتشر کرده که بر پایه مدل Qwen3-8B علیبابا است.
🔸 این مدل کوچک در تستهای ریاضی دشوار مثل AIME 2025 از مدل Gemini 2.5 Flash گوگل بهتر عمل کرده و در تست HMMT نیز عملکردی نزدیک به Phi 4 مایکروسافت داشته است.
🔸 مزیت کلیدی این مدلهای کوچکتر نسبت به نسخههای بزرگ، نیاز به قدرت محاسباتی بسیار کمتر برای اجراست.
🔸 DeepSeek این مدل را با لایسنس MIT منتشر کرده، به این معنی که استفاده تجاری از آن بدون محدودیت و رایگان است.
#هوش_مصنوعی #DeepSeek #AI
