دیپ‌سیک هزینه پردازش متون طولانی را نصف می‌کند

🔸 شرکت چینی DeepSeek از مدل آزمایشی V3.2-exp رونمایی کرد که هزینه پردازش (Inference) متون طولانی را به شدت کاهش می‌دهد.

🔸 این مدل با تکنیک «توجه پراکنده» (Sparse Attention)، فقط بخش‌های کلیدی متن را برای تحلیل انتخاب می‌کند و بار سرور را کم می‌کند.

🔸 طبق تست‌های اولیه، این روش می‌تواند هزینه API را تا ۵۰٪ کاهش دهد. این مدل به صورت متن‌باز در هاگینگ‌فیس منتشر شده است.

#هوش_مصنوعی #دیپ_سیک

منبع

telegram
youtube