DeepSeek представила оптимизированную под китайские чипы модель V3.1

92

Китайская компания DeepSeek разработала ИИ-модель V3.1, адаптированную для использования чипов местного производства с режимом «мышление» и без него, сообщает в четверг South China Morning Post.

Издание отмечает расширенные «агентские» возможности (т.е. возможности автономной работы ИИ-модели «на борту» устройства – ред.) V3.1.

Смещение фокуса в сторону ИИ-агентов может свидетельствовать о том, что DeepSeek откажется от планов выпустить модель R2. По информации западных СМИ, с разработкой этого продукта возникли проблемы.

Утверждается, что власти КНР рекомендовали DeepSeek использовать процессоры Ascend, а не «системы Nvidia». Из-за этого разработчик столкнулся с постоянно возникающими техническими проблемами в процессе обучения R2. В конечном итоге в DeepSeek решили использовать чипы Nvidia на одном из этапов обучения модели.

Сообщается, что V3.1 оптимизирована для работы с «китайскими чипами следующего поколения, которые скоро появятся на рынке».

Чтобы не пропустить самое интересное, читайте нас в Телеграм

Поделиться:

ОСТАВЬТЕ ОТВЕТ

Пожалуйста, введите ваш комментарий!
пожалуйста, введите ваше имя здесь