Пусть AI-агенты проверяют работу друг друга

Приём, который сильнее всего поднимает качество AI: не верь одному ответу. Пусть второй агент его челленджит, пытается сломать и вытащит то, что первый упустил.

6 мин чтенияОбновлено 2026-06-15ЕАЕвгений АрсентьевЕвгений Арсентьев · PhD

Вот один приём, который поднимает качество AI-работы сильнее любого хитрого промпта: перестань верить одному ответу. Пусть второй агент независимо его проверит — челленджит, попробует сломать, поохотится за тем, что не так. Один AI может звучать гладко и быть уверенно неправ; второй, у которого единственная работа — спорить, ловит то, мимо чего первый проскользнул. Так ты получаешь экспертную надёжность, сам не будучи экспертом.

Почему одного ответа AI мало

AI всегда звучит уверенно — даже когда ошибается. Он может выдумать факт, упустить краевой случай или «починить» баг, который всё ещё на месте, и отрапортовать обо всём тем же уверенным тоном (это и есть проблема галлюцинаций). Если действуешь по первому ответу — наследуешь и его ошибки. Лечится не «ответом получше», а вторым мнением.

Что значит «агенты челленджат друг друга»

Ты даёшь одному агенту сделать работу, а потом подключаешь СВЕЖЕГО агента с другой ролью: не быть полезным, а быть скептиком. «Вот решение — найди в нём все изъяны. Считай, что оно неверно, пока не доказано обратное.» Раз второй агент не писал первый ответ, ему за него не обидно — и он ковыряет дыры, которые оригинал бы защищал. Слабые ответы разваливаются под этим давлением; сильные — выживают.

Автор и редактор

Ни одна серьёзная статья не выходит прямо из-под автора. Редактор — вторая пара глаз, чья работа находить проблемы, — читает на свежую голову и рвёт слабые места. Те же слова, результат острее. Сделать из двух агентов «автора и редактора» — это ровно оно, за минуты, для чего угодно, что ты строишь.

Три способа заставить их челленджить друг друга

Выбери подходящий паттерн

  1. 1ПРОВЕРКА: один агент решает, второй проверяет каждое утверждение — «попробуй опровергнуть это; отметь всё, что не можешь подтвердить». Лучше всего для фактов, ресёрча и вопроса «а баг правда починен?».
  2. 2ДЕБАТЫ: два агента спорят с противоположных сторон («лучше этот подход» vs. «нет, вот этот»), затем третий читает обоих и решает. Лучше всего для выборов и компромиссов.
  3. 3ГОЛОСОВАНИЕ: три агента решают одно и то же независимо, а ты берёшь ответ, в котором они сошлись. Независимые попытки редко делят одну ошибку, так что согласие — сильный сигнал.
Почему это так хорошо работает

Две причины. Первая: независимые агенты редко делают ОДНУ И ТУ ЖЕ ошибку — поэтому расхождение между ними как мигающая лампочка над слабым местом. Вторая: важна формулировка. Агент, которому сказали «проверь это», вежлив и склонен одобрить; агент, которому сказали «попробуй ОПРОВЕРГНУТЬ это, считай неверным, пока не доказано», реально копает. Скептическая постановка превращает штамп «одобрено» в настоящую проверку.

Как это попросить?

Скажи что-то вроде
Реши это, потом запусти свежего агента, у которого единственная работа — найти все изъяны в решении: пусть считает ответ неверным, пока не доказано обратное, и доложит, какие проблемы настоящие.

Ты не судишь сам. Ты описываешь роли — решатель, затем скептик — и Claude гоняет обоих и отдаёт тебе вердикт. Добавь третьего «судью», когда нужен финальный выбор между конкурирующими ответами.

!Честные оговорки

Это тратит больше проходов, чем один ответ — но на личной подписке они уже включены (см. гайд «Запусти 10 AI-агентов разом»), так что качество по сути бесплатно. Два предела, которые стоит уважать: раунд челленджа снижает риск, но не обнуляет его — для чего-то важного финальный результат всё равно просматриваешь сам; и не заморачивайся ради крошечных очевидных задач, где хватает одного ясного запроса.

Quick check

Почему то, что второй агент челленджит первого, повышает качество?

Вывод

Никогда не сдавай первый ответ. Пусть один агент делает работу, а другой рвёт её на части — проверка, дебаты или голосование. Это самое близкое к найму эксперта-ревьюера, на подписке не стоит ничего сверху и превращает «наверное, верно» в «реально проверено».

#ai agents#verification#quality#claude code
ЕАЕвгений Арсентьев

Автор

Евгений Арсентьев

PhD · Директор по продукту (CPO) в healthtech-компании

▌ Чтение — это синяя пилюля

Хочешь реально это построить?

Гайды объясняют. Бесплатный курс превращает — персонально, с геймификацией и заточенный на быстрый запуск.

◉ Начать бесплатный курс →