Китайский IT-гигант Alibaba разработал и представил собственную ИИ-модель Qwen2.5-Max, которая, как утверждается, превосходит по ряду параметров наделавшую много шума DeepSeek V3, пишет в среду msn.com.
Сообщается, что Qwen2.5-Max обучалась более чем на 20 триллионах токенов с использованием метода «смешения экспертов» (Mixture of experts, MoE). Затем модель дообучили «вручную» методом Supervised Fine-Tuning, а также задействовали обучение с подкреплением.
По информации издания, модель от Alibaba обошла по ряду показателей DeepSeek и продемонстрировала сопоставимые результаты по отношению к ряду других.
Напомним, среди характеристик модели DeepSeek значатся: глубокое «понимание» китайского и английского языков, высококачественные переводы без потери смысла, поддержка программирования на шести языках: C++, Go, Java, JavaScript, Python и Rust.
См. также: Американская индустрия ИИ вошла в стадию отрицания DeepSeek >>>