Китайская компания представила первую обученную полностью на местном «железе» ИИ-модель

25

Одна из ведущих китайских компаний в сфере интернет-торговли Meituan представила первую обученную полностью на китайских процессорах большую языковую модель LongCat-2.0, а также открыла доступ к её исходному коду, пишет во вторник South China Morning Post.

Новая модель обладает 1,6 триллиона параметров и контекстным окном (объём текста в токенах, который модель способна запоминать за раз) в миллион токенов. Это ставит LongCat-2.0 в один ряд с последней моделью DeepSeek V4-pro, представленной в апреле.

В случае с V4-pro китайские чипы использовались только для инференса (процесса использования уже обученной модели для решения задачи). При создании LongCat-2.0 применялось китайское оборудование как для инференса, так и предобучения – во время которого ИИ-модель усваивает большие массивы данных для выявления базовых закономерностей.

Meituan не указала конкретно, чьё оборудование использовала, однако издание считает, что модель обучалась посредством технологий Huawei.

Напомним, Huawei разработала ранее замену чипам Nvidia на фоне ограничений со стороны Вашингтона доступа китайских компаний к американским технологиям.

См. также: Представитель Huawei заявила о достижении в технологии производства микросхем

Чтобы не пропустить самое интересное, читайте нас в Max и Телеграм

Поделиться:

ОСТАВЬТЕ ОТВЕТ

Пожалуйста, введите ваш комментарий!
пожалуйста, введите ваше имя здесь

Какого цвета солнце на детских рисунках? (1-жёлтое, 2-синее)