Пусть AI-агенты проверяют работу друг друга
Приём, который сильнее всего поднимает качество AI: не верь одному ответу. Пусть второй агент его челленджит, пытается сломать и вытащит то, что первый упустил.
Вот один приём, который поднимает качество AI-работы сильнее любого хитрого промпта: перестань верить одному ответу. Пусть второй агент независимо его проверит — челленджит, попробует сломать, поохотится за тем, что не так. Один AI может звучать гладко и быть уверенно неправ; второй, у которого единственная работа — спорить, ловит то, мимо чего первый проскользнул. Так ты получаешь экспертную надёжность, сам не будучи экспертом.
Почему одного ответа AI мало
AI всегда звучит уверенно — даже когда ошибается. Он может выдумать факт, упустить краевой случай или «починить» баг, который всё ещё на месте, и отрапортовать обо всём тем же уверенным тоном (это и есть проблема галлюцинаций). Если действуешь по первому ответу — наследуешь и его ошибки. Лечится не «ответом получше», а вторым мнением.
Что значит «агенты челленджат друг друга»
Ты даёшь одному агенту сделать работу, а потом подключаешь СВЕЖЕГО агента с другой ролью: не быть полезным, а быть скептиком. «Вот решение — найди в нём все изъяны. Считай, что оно неверно, пока не доказано обратное.» Раз второй агент не писал первый ответ, ему за него не обидно — и он ковыряет дыры, которые оригинал бы защищал. Слабые ответы разваливаются под этим давлением; сильные — выживают.
Ни одна серьёзная статья не выходит прямо из-под автора. Редактор — вторая пара глаз, чья работа находить проблемы, — читает на свежую голову и рвёт слабые места. Те же слова, результат острее. Сделать из двух агентов «автора и редактора» — это ровно оно, за минуты, для чего угодно, что ты строишь.
Три способа заставить их челленджить друг друга
Выбери подходящий паттерн
- 1ПРОВЕРКА: один агент решает, второй проверяет каждое утверждение — «попробуй опровергнуть это; отметь всё, что не можешь подтвердить». Лучше всего для фактов, ресёрча и вопроса «а баг правда починен?».
- 2ДЕБАТЫ: два агента спорят с противоположных сторон («лучше этот подход» vs. «нет, вот этот»), затем третий читает обоих и решает. Лучше всего для выборов и компромиссов.
- 3ГОЛОСОВАНИЕ: три агента решают одно и то же независимо, а ты берёшь ответ, в котором они сошлись. Независимые попытки редко делят одну ошибку, так что согласие — сильный сигнал.
Две причины. Первая: независимые агенты редко делают ОДНУ И ТУ ЖЕ ошибку — поэтому расхождение между ними как мигающая лампочка над слабым местом. Вторая: важна формулировка. Агент, которому сказали «проверь это», вежлив и склонен одобрить; агент, которому сказали «попробуй ОПРОВЕРГНУТЬ это, считай неверным, пока не доказано», реально копает. Скептическая постановка превращает штамп «одобрено» в настоящую проверку.
Как это попросить?
Реши это, потом запусти свежего агента, у которого единственная работа — найти все изъяны в решении: пусть считает ответ неверным, пока не доказано обратное, и доложит, какие проблемы настоящие.
Ты не судишь сам. Ты описываешь роли — решатель, затем скептик — и Claude гоняет обоих и отдаёт тебе вердикт. Добавь третьего «судью», когда нужен финальный выбор между конкурирующими ответами.
Это тратит больше проходов, чем один ответ — но на личной подписке они уже включены (см. гайд «Запусти 10 AI-агентов разом»), так что качество по сути бесплатно. Два предела, которые стоит уважать: раунд челленджа снижает риск, но не обнуляет его — для чего-то важного финальный результат всё равно просматриваешь сам; и не заморачивайся ради крошечных очевидных задач, где хватает одного ясного запроса.
Почему то, что второй агент челленджит первого, повышает качество?
Никогда не сдавай первый ответ. Пусть один агент делает работу, а другой рвёт её на части — проверка, дебаты или голосование. Это самое близкое к найму эксперта-ревьюера, на подписке не стоит ничего сверху и превращает «наверное, верно» в «реально проверено».

Автор
Евгений Арсентьев
PhD · Директор по продукту (CPO) в healthtech-компании
▌ Чтение — это синяя пилюля
Хочешь реально это построить?
Гайды объясняют. Бесплатный курс превращает — персонально, с геймификацией и заточенный на быстрый запуск.
◉ Начать бесплатный курс →