Qwen создала симулятор для тренировки ИИ-агентов
Qwen выпустила AgentWorld — симулятор сред для ИИ-агентов (до 397B параметров), обученный на 10 млн реальных взаимодействий агентов в 7 задачных доменах.
Евгений Арсентьев · PhDКоманда Qwen из Alibaba выпустила Qwen-AgentWorld — пару языковых мировых моделей, которые симулируют среды, в которых работают ИИ-агенты. Две версии по размеру: Qwen-AgentWorld-35B-A3B и значительно большая Qwen-AgentWorld-397B-A17B. Обе обучены на более чем 10 миллионах траекторий взаимодействий агентов в семи задачных доменах — реальных задачах, которые выполняли реальные агенты.
Главная идея — в том, что здесь означает «мировая модель». Когда ИИ-агент работает над задачей и делает шаг — открывает файл, вызывает API, запускает команду — ему нужно предсказать, что произойдёт дальше. Обычно это выясняется в реальной системе: долго, дорого и с риском что-то сломать. Мировая модель меняет это: вместо того чтобы вызывать реальный инструмент, агент обращается к модели, которая предсказывает результат. Можно репетировать сложные многошаговые сценарии в симуляции, не трогая живую среду. Как тренажёр пилота — ошибки обходятся в разы дешевле, чем в настоящем самолёте.
Что показывают тесты
Qwen оценила AgentWorld на девяти установленных тестах против пяти передовых моделей и сообщает о значительном превосходстве на AgentWorldBench — оценке, специально разработанной для точности симуляции в агентных задачах. Обучение проходило в три этапа: широкое предобучение для общих способностей, тонкая настройка на предсказание следующего состояния и фаза обучения с подкреплением для повышения точности симуляции. В работе приняли участие более 27 исследователей из команды Qwen.
Если ты сейчас активно запускаешь агентов на реальных задачах — следи, как быстро такие исследования превращаются в готовые инструменты. Работа пока академическая, но направление понятное: серьёзные лаборатории хотят сократить число реальных прогонов при разработке агентов. Когда это станет доступным на практике, цикл разработки сильно ускорится.
Для тех, кто собирает агентные инструменты, ближайшее значение — в стоимости и безопасности. Сейчас добиться надёжности от ИИ-агентов можно только через много итераций в реальных системах: API вызываются, базы запрашиваются, ошибки стоят времени или денег. Хорошая мировая модель сокращает количество нужных реальных прогонов. Работа Qwen впервые делает этот подход обоснованным при серьёзных масштабах.
Мировое моделирование для агентов было исследовательской целью несколько лет. Большинство ранних попыток работало в узких областях или на учебных задачах. То, что крупная лаборатория уровня Qwen опубликовала модель на 397 миллиардов параметров, охватывающую семь реальных агентных доменов, — ощутимый шаг вперёд. Сегодня это не меняет то, что можно построить. Но это именно та инфраструктурная работа, которая делает завтрашних агентов дешевле в обучении, быстрее в итерации и надёжнее в работе.
Гайды по теме

Автор
Евгений Арсентьев
PhD · Директор по продукту (CPO) в tech-компании
Хочешь реально это построить?
Гайды объясняют. Бесплатный курс превращает — персонально, с геймификацией и заточенный на быстрый запуск.
◉ Начать бесплатный курсИсточник: arxiv.org