Prime Intellect открыла движок для обучения ИИ-кодеров

Prime Intellect открыла prime-rl 0.6.0 — фреймворк, на котором обучался GLM-5. Теперь обучить ИИ-кодер на триллион параметров можно на 28 серверах.

4 мин чтенияЕАЕвгений АрсентьевЕвгений Арсентьев · PhD

Prime Intellect выпустила prime-rl 0.6.0 — полностью открытый фреймворк для обучения больших ИИ-моделей задачам автономного кодирования. Он не новый внутри компании: именно на нём обучали GLM-5 — модель от Z.ai, которая при выходе в начале июня вошла в число сильнейших открытых ИИ-кодеров. Теперь рецепт в открытом доступе.

Метод обучения работает так: модель решает реальные задачи по программированию, смотрит на результат и учится на том, что сработало, а что нет — примерно как разработчик становится лучше, выкатывая код и читая сообщения об ошибках, а не заучивая учебник. В таком масштабе это очень затратно, но prime-rl делает это посильным: весь цикл обучения GLM-5 уместился на 28 серверах с мощными чипами, и каждый шаг занимал меньше пяти минут. Для модели на триллион параметров — которая работает через множество специализированных подсетей, активируя лишь часть из них при каждом запросе — это впечатляющая эффективность.

Что это меняет для ИИ-инструментов, которыми ты пользуешься

Эта история не столько про сам prime-rl, сколько про то, что он открывает. Построить ИИ-кодер уровня лучших мировых моделей раньше требовало инфраструктуры, которая была по карману только крупнейшим лабораториям. Prime Intellect показала, что того же результата можно достичь на среднем кластере серверов — и теперь опубликовала инструкцию.

Чем больше команд может обучать модели такого уровня, тем выше конкуренция в пространстве открытых моделей. Kimi K2.7 Code, Nvidia Nemotron, GLM-5 — все эти модели prime-rl тестировал или обучал, и все они доступны для запуска на собственном сервере, бесплатно, без платы за каждый запрос. Чем больше команд строит на этом уровне, тем больше у тебя выбора как у билдера, которому не хочется зависеть от подписки или лимитов.

Открытая инфраструктура обучения — наименее заметная часть ИИ-стека для большинства, но она сильно влияет на то, какие модели появляются в открытом доступе. Разрыв между лучшими закрытыми и лучшими открытыми моделями стремительно сокращается — и такие фреймворки, как prime-rl, — одна из главных причин этого.

Что бы я сделал

Если ты работаешь с открытыми моделями — локально или через свой сервер — следи прямо сейчас за GLM-5.2 и Kimi K2.7 Code. Обе обучены с применением такого же подхода «практика и обратная связь» и реально конкурируют с платными сервисами на задачах кодирования. Лучший бесплатный вариант сейчас меняется очень быстро.

#open-source#models#coding#research

Гайды по теме

ЕАЕвгений Арсентьев

Автор

Евгений Арсентьев

PhD · Директор по продукту (CPO) в tech-компании

Хочешь реально это построить?

Гайды объясняют. Бесплатный курс превращает — персонально, с геймификацией и заточенный на быстрый запуск.

◉ Начать бесплатный курс

Источник: marktechpost.com