Китайская корпорация Meituan выложила в открытый доступ модель LongCat-2.0 архитектуры Mixture-of-Experts объемом 1,6 триллиона параметров. Все обучение производилось исключительно на китайских ускорителях без использования запрещенных к экспорту чипов NVIDIA.
В условиях жестких торговых санкций и экспортных ограничений со стороны правительства США китайские технологические гиганты вынуждены искать альтернативные пути для развития искусственного интеллекта. Ярким примером этого стал новый релиз от компании Meituan.
Сверхкрупная модель LongCat-2.0
Новая модель получила название LongCat-2.0 и относится к классу Mixture-of-Experts (MoE, «смесь экспертов»). В такой архитектуре для каждого запроса активируется лишь небольшая часть из 1,6 триллиона параметров, что делает инференс экономически подъемным. Модель демонстрирует высокие показатели в понимании текста, логическом анализе и генерации программного кода.
Обучение на отечественных ASIC
Самым важным аспектом проекта является то, что LongCat-2.0 была полностью обучена в Китае на отечественных специализированных микросхемах (ASIC) без применения американских графических процессоров (таких как NVIDIA H100 или A100). Это достижение подтверждает, что китайская ИИ-индустрия способна создавать и обучать модели терагерцового масштаба, используя локальные альтернативные чипы.
Источники
- VentureBeat, 2026-06-30
