Бесплатная модель на триллион параметров кодит как топ
Открытая Kimi K2.7 Code от Moonshot AI — модель на 1 трлн параметров, которую ставишь на свой сервер; на кодинг-тесте 62 и «думает» на 30% короче.
Евгений Арсентьев · PhDMoonshot AI выпустила Kimi K2.7 Code — модель с открытыми весами, заточенную под написание кода и работу в кодинг-агентах. На бумаге она огромная: архитектура Mixture-of-Experts с триллионом параметров суммарно, но на любой запрос включаются лишь 32 миллиарда из них. Подход «большой мозг — маленький счёт» и объясняет, почему такая крупная модель всё же работает на практичной скорости: каждый раз поднимается только нужная её часть, а не весь триллион сразу.
Прирост по сравнению с прошлой Kimi конкретный. По собственному тесту Moonshot, Kimi Code Bench v2, новая модель набирает 62.0 против 50.9. Агентные баллы тоже выросли — 76.0 на одном тесте по работе с инструментами (было 69.4) и 81.1 на другом (было 72.8). Она держит в контексте около 256 000 токенов за раз — этого хватает, чтобы видеть большой кусок кодовой базы, — и, что важно, тратит примерно на 30% меньше токенов на «размышление», чем прошлая версия, то есть отвечает быстрее, при этом лучше доводя реальные задачи до конца.
Главное здесь — открытые веса
От сервиса вроде ChatGPT или Claude это отличают не только цифры тестов, а то, что веса открыты — под лицензией Modified MIT. «Открытые веса» значит, что сам файл модели можно скачать: запустить её на своём сервере, держать исходники у себя, а не отправлять чужой компании, и не платить за каждый запрос. Она работает на распространённых открытых движках (vLLM, SGLang, KTransformers) и идёт с небольшим зрительным блоком, так что умеет читать картинки и скриншоты, а не только текст.
Для билдера практичная зацепка в том, что модель подключается к привычной агентной обвязке, которой многие уже пользуются, — в том числе через MCP, общий протокол, позволяющий ИИ дотягиваться до внешних инструментов: браузера, твоих файлов, базы данных. Сильный рост на тестах в стиле MCP говорит, что она реально лучше в многошаговой работе с переписками туда-сюда, которую делают агенты, а не только в выдаче одной функции.
Почему это важно для тебя
Ещё недавно топовая помощь с кодом означала аренду у горстки закрытых провайдеров и плату за каждый вызов. Бесплатная скачиваемая модель с такими баллами — и работающая на твоём железе — подтачивает этот расклад. Если ты собираешь штуки, общаясь с кодинг-агентом, у тебя теперь есть серьёзная альтернатива, которая не запирает тебя и не считает деньги за каждый запрос.
Моя мысль: 30%-ное падение «думающих» токенов — недооценённая строка. Рассуждающие модели часто берут тесты, сжигая огромные объёмы вычислений на «размышление», отчего в повседневной работе они медленные и дорогие. Давать результат лучше, думая при этом меньше, — ровно тот размен, который делает модель приятной в реальном использовании.
«Открытые веса» — фраза, которую стоит запомнить: значит, модель можно скачать и запустить на своей машине, держа код приватным и не платя за каждый запрос. Kimi K2.7 Code — почти топовая кодинг-модель, которую можно держать у себя; стоит взглянуть, если устал от платных закрытых ассистентов.
Гайды по теме

Автор
Евгений Арсентьев
PhD · Директор по продукту (CPO) в tech-компании
Хочешь реально это построить?
Гайды объясняют. Бесплатный курс превращает — персонально, с геймификацией и заточенный на быстрый запуск.
◉ Начать бесплатный курсИсточник: huggingface.co