🔸 مدلهای هوش مصنوعی در استدلال روی متون کوتاه خوبند اما با ورودیهای بسیار طولانی (مثلا گزارشهای مالی یا قراردادها) مشکل دارند.
🔸 علیبابا با فریمورک QwenLong-L1 این چالش را حل کرده. این روش آموزش چند مرحلهای به مدلها یاد میدهد متون بلند را بفهمند و دقیق روی آنها استدلال کنند.
🔸 نتایج عالی است؛ مدلهای آموزشدیده با QwenLong-L1 در فهم اسناد طولانی بهتر از رقبایی مثل گوگل و OpenAI و در حد Claude عمل میکنند.
🔸 این پیشرفت برای شرکتها، مثلا در تحلیل اسناد حقوقی و مالی، کاربرد گستردهای دارد. کد و مدلها هم منتشر شدهاند.
#هوش_مصنوعی #علی_بابا #مدل_زبانی
