Китайцы представили ещё одну высокопроизводительную ИИ-модель – Qwen2.5-Max

29.01.2025

613

Китайский IT-гигант Alibaba разработал и представил собственную ИИ-модель Qwen2.5-Max, которая, как утверждается, превосходит по ряду параметров наделавшую много шума DeepSeek V3, пишет в среду msn.com.

Сообщается, что Qwen2.5-Max обучалась более чем на 20 триллионах токенов с использованием метода «смешения экспертов» (Mixture of experts, MoE). Затем модель дообучили «вручную» методом Supervised Fine-Tuning, а также задействовали обучение с подкреплением.

По информации издания, модель от Alibaba обошла по ряду показателей DeepSeek и продемонстрировала сопоставимые результаты по отношению к ряду других.

Напомним, среди характеристик модели DeepSeek значатся: глубокое «понимание» китайского и английского языков, высококачественные переводы без потери смысла, поддержка программирования на шести языках: C++, Go, Java, JavaScript, Python и Rust.

См. также: Американская индустрия ИИ вошла в стадию отрицания DeepSeek >>>

Чтобы не пропустить самое интересное, читайте нас в Max и Телеграм