Семь ИИ-агентов превращают CSV в новостную статью

Оксфорд и Стэнфорд собрали Data2Story — конвейер из семи ИИ-агентов, который делает из CSV интерактивную статью, где 93% утверждений проверяемы.

4 мин чтенияЕАЕвгений АрсентьевЕвгений Арсентьев · PhD

Исследователи из Оксфорда и Стэнфорда собрали систему, которая превращает сырую таблицу в готовую интерактивную новостную статью, — и сделали её как навык поверх Claude Code. Data2Story координирует семь ИИ-агентов, передающих CSV-файл по конвейеру: каждый отвечает за свою часть. На выходе — опубликованная веб-страница, где 93% всех видимых утверждений восходят к источнику: данным, коду или внешней ссылке.

Семь ролей похожи на маленькую редакцию. «Детектив» ищет контекст в сети. «Аналитик» запускает реальный код, чтобы посчитать цифры, а не прикинуть их. «Редактор» выбирает, какие находки ведут сюжет. «Дизайнер» подбирает формат — карту для географии, график для трендов. «Программист» строит HTML, «Аудитор» проверяет вёрстку на ошибки, а «Инспектор» связывает каждое утверждение с его источником. Под капотом — Claude Opus 4.7, плюс сторонние модели для картинок и медиа.

Читателям зашло — но со звёздочкой

В исследовании с 53 читателями, сравнивавшими работу агента с написанными людьми оригиналами на 18 наборах данных, 74% выбрали статью агента, 25% — человеческую версию, 2% назвали ничьей. Агент выиграл во всех пяти категориях оценки, с наибольшим перевесом по прозрачности. Причина — та самая цифра проверяемости: 93% утверждений можно проверить против базовых 25% у человеческих статей, где большинство фраз попросту не привязаны к источнику.

Но авторы аккуратны в формулировках. Проверяемое — не то же самое, что верное: это значит, что утверждение можно проследить до источника, а не что источник прав. А против дизайнерских, вручную сделанных лонгридов The Pudding преимущество агента растворялось в статистической ничьей. Система по-прежнему проигрывает в трёх вещах: редакторском суждении о том, почему что-то произошло, по-настоящему творческом дизайне и плотной графике, где в одну визуализацию упаковано многое.

Почему это важно для тебя

Большинство тех, кто работает с данными, статей не пишет — но превращает цифры в то, что другим придётся читать и чему доверять: отчёт, выжимку из дашборда, слайд. Интересно в Data2Story не то, что он пишет, а то, что он заставляет каждое число нести квитанцию. Привычка «сделай утверждение — и сразу покажи, откуда оно» и отличает заслуживающую доверия выжимку от просто уверенно звучащей.

Это ещё и наглядный пример того, где мультиагентные системы реально помогают. Одна модель, которой говорят «напиши статью из этого CSV», обычно смешивает факты и текст в кашу. Разделение труда — один агент считает, другой проверяет, третий просто сверяет ссылки — даёт результат, который можно проаудитировать. Такая структура применима далеко за пределами журналистики — в любой задаче, где проверяемость важнее скорости.

Моя оценка: разрыв 93% против 25% — вот строчка, которую стоит запомнить. Это тихий приговор тому, как редко человеческие выжимки вообще привязывают свои утверждения хоть к чему-то, и напоминание: планка, которую должен взять ИИ-инструмент, нередко ниже, чем кажется, потому что человеческая база сама срезает кучу углов.

Что бы я сделал

В следующий раз, отдавая кому-то выжимку по данным, укради одну привычку, которая принесла этой системе победу: привяжи источник к каждому числу. Даже ссылка или ссылка на ячейку рядом с каждым утверждением превращает «поверь мне» в «проверь меня» — а именно это читатель и вознаграждает.

#AI agents#research#Claude

Гайды по теме

ЕАЕвгений Арсентьев

Автор

Евгений Арсентьев

PhD · Директор по продукту (CPO) в tech-компании

Хочешь реально это построить?

Гайды объясняют. Бесплатный курс превращает — персонально, с геймификацией и заточенный на быстрый запуск.

◉ Начать бесплатный курс

Источник: the-decoder.com