Codex от OpenAI учится задаче, посмотрев один раз

Агент Codex теперь записывает процесс, который ты показал один раз, превращает его в навык и повторяет сам — на macOS, для платных пользователей.

4 мин чтенияЕАЕвгений АрсентьевЕвгений Арсентьев · PhD

Агент Codex от OpenAI теперь может выучить задачу, посмотрев, как ты делаешь её один раз. Новая функция Record & Replay позволяет показать рабочий процесс на экране однократно: Codex фиксирует шаги, превращает их в многоразовый «навык» и дальше выполняет всё сам, без повторных объяснений.

Пример из релиза нарочито бытовой: загрузка ролика на YouTube вместе с обложкой, описанием и субтитрами. Сделай это один раз под наблюдением Codex — и следующая загрузка превращается в повтор в один клик. Функция вышла в версии Codex 26.616, вместе с массовыми действиями в истории автоматизаций и возможностью передавать тред между локальной и удалённой машиной.

Нюанс: где и как это работает

Ограничения вполне реальные. Record & Replay живёт в приложении Codex на macOS, требует включённого режима Computer Use у агента и платного аккаунта ChatGPT, чтобы делать что-то полезное; само приложение бесплатно для скачивания. На момент анонса 20 июня функции нет в ЕС, Британии и Швейцарии — хотя сам Computer Use открылся в ЕС 16 июня, так что разрыв может сократиться.

Если ты уже работал с агентами, знаешь типичную проблему: иногда объясняешь задачу словами так долго, что проще было сделать самому. Запись это обходит. Ты не пишешь техзадание, ты показываешь — а показ несёт те мелкие, неудобные детали, которые тяжело описать, но легко продемонстрировать.

Почему это важно для тебя

Бóльшая часть нудной работы за компьютером — это одна и та же горстка шагов по кругу: переименовать и разложить файлы, заполнить ту же форму, собрать те же цифры в тот же отчёт, выложить контент в те же три места. Именно их муторно описывать в промпте, но элементарно показать. «Записал один раз — повторяй вечно» — куда более низкий порог, чем учиться писать хорошие инструкции.

Это меняет и то, кто вообще может автоматизировать. Раньше, чтобы превратить процесс в скрипт, нужен был тот, кто умеет кодить или хотя бы возиться с no-code. Показать компьютеру, что делать, просто делая это, — навык, который уже есть у каждого. В этом и тихая значимость: интерфейс автоматизации смещается от языка к показу.

Честная оговорка: агент, повторяющий твои клики, надёжен ровно настолько, насколько мир стоит на месте. Стоит кнопке сдвинуться или странице обновить дизайн — записанный навык ломается там, где человек бы просто пожал плечами. Относись к повторам как к младшему помощнику, а не готовому станку: быстро, удобно — и проверь глазами, прежде чем довериться.

Что бы я сделал

Возьми одну задачу, которую делаешь каждую неделю и ненавидишь — самую кликовую и повторяющуюся, — и запиши сначала её. Прогони повтор несколько раз под присмотром, прежде чем отпускать без контроля. Цель не в том, чтобы автоматизировать всё, а в том, чтобы убрать ту единственную рутину, которая крадёт больше всего времени.

#OpenAI#AI agents#automation

Гайды по теме

ЕАЕвгений Арсентьев

Автор

Евгений Арсентьев

PhD · Директор по продукту (CPO) в tech-компании

Хочешь реально это построить?

Гайды объясняют. Бесплатный курс превращает — персонально, с геймификацией и заточенный на быстрый запуск.

◉ Начать бесплатный курс

Источник: the-decoder.com