GLM-5.2: модель для кода с окном на 1 млн токенов

Z.ai выпустила GLM-5.2: контекст 1 млн токенов, два уровня усилия и Anthropic-совместимый эндпоинт для Claude Code. Веса под MIT обещают через неделю.

↻ Опубликовано 2026-06-15◷ 5 мин чтенияЕА

Евгений Арсентьев · PhD

Новые посты каждый деньПодпишись на мой TelegramAI-новости и фишки Claude Code — каждый день, первым деломПодписаться →Бесплатный курс по Claude CodeБез апсейлов и кросс-сейлов — здесь нечего купить.Начать →

Z.ai выпустила GLM-5.2 — модель для кода с контекстным окном в один миллион токенов и выбором из двух режимов рассуждения, «High» и «Max». В первый же день она работает с восемью агентными инструментами для разработки — среди них Claude Code, Cline, OpenCode и OpenClaw — через Anthropic-совместимый эндпоинт, так что существующую связку можно перенацелить на неё почти без переделок. Веса выходят под лицензией MIT, но пока не сейчас: Z.ai обещает их на следующей неделе.

Главная цифра — размер окна. Миллион токенов на входе примерно впятеро больше, чем держала GLM-5.1, и слово «реально используемое» здесь ключевое: вендоры и раньше заявляли огромные окна, которые рассыпались уже после пары сотен тысяч токенов. Для кода окно такого размера означает, что агент может держать перед глазами целый средний репозиторий вместе с тестами и документацией, а не догадываться по горстке файлов. На выходе — до примерно 131 000 токенов за ответ, чего хватает, чтобы переписать крупные куски за один проход.

Что на самом деле меняют «High» и «Max»

Два уровня усилия — это регулятор того, как усердно модель думает перед ответом. «High» — повседневный режим; «Max» тратит больше вычислений на многошаговые задачи (тот самый зубодробительный рефакторинг, баг на пять файлов) ценой скорости и токенов. Это перекликается с более широким сдвигом этого года: глава Microsoft Сатья Наделла предостерегает от «token-maxing» — привычки хвататься за самый дорогой режим на каждой мелочи. Навык в том, чтобы подбирать усилие под задачу, а не всегда выкручивать на максимум.

Под капотом — модель Mixture-of-Experts на 744 млрд параметров, из которых на каждый токен активируются 40 млрд: огромная в сумме, экономная на запрос. Честная оговорка: на старте Z.ai не показала ни одного бенчмарка. Ни SWE-bench, ни Terminal-Bench, ни Code Arena. Это реальный пробел — пока нет ни весов, ни цифр, заявления о качестве держатся на спецификации и первых отзывах, а не на независимых тестах.

Почему это важно не только разработчикам: тихая суть — в Anthropic-совместимом эндпоинте. Всё больше провайдеров копируют форму этого API, а значит, инструмент и стоящая за ним модель расцепляются. Если одну модель отключат — как на прошлой неделе Fable у Anthropic — или внезапно поменяется цена, можно перенацелиться на альтернативу, не переучивая рабочий процесс. Открытые веса под MIT идут дальше: со временем модель можно будет запускать у себя.

✓Что бы я сделал

Если ты уже пользуешься Claude Code или Cline, попробовать GLM-5.2 — почти без риска: укажи Anthropic-совместимый базовый URL на эндпоинт Z.ai и прогони её на реальной задаче, которую уже решал, чтобы было с чем сравнить. Начинай с «High», переключайся на «Max» только когда задача правда того требует, и дождись MIT-весов и настоящих бенчмарков, прежде чем доверять ей что-то важное.

#models#open-models#coding-tools

Гайды по теме

ЕА

Автор

Евгений Арсентьев

PhD · Директор по продукту (CPO) в tech-компании

Об авторе →

Хочешь реально это построить?

Гайды объясняют. Бесплатный курс превращает — персонально, с геймификацией и заточенный на быстрый запуск.

◉ Начать бесплатный курс

← Все новости

Источник: marktechpost.com