Попроси ИИ 100 аргументов — и они все окажутся похожи
ИИ пишет гладко, но его аргументы повторяются: Pangram CEO объясняет, почему у ИИ-текстов «узкий» диапазон аргументов, а у людей — нет.
Евгений Арсентьев · PhDГенеральный директор Pangram — компании, которая создаёт детекторы ИИ-текста — Макс Спиро описал кое-что нетривиальное о том, как языковые модели выдают себя. Не грамматические ошибки. Не штампы вроде «конечно» или «как ИИ». А то, что когда просишь модель придумать 100 аргументов на любую тему, получаешь 100 аргументов, которые собираются в узкий кластер. Попроси 100 разных людей — и получишь куда более разбросанный результат.
«Попроси языковую модель назвать 100 аргументов на тему — они соберутся в узкий диапазон. А пространство человеческих аргументов будет куда более разнообразным», — объяснил Спиро в интервью AI Policy Perspectives. Детектор Pangram работает на основе нейросети-классификатора, который ищет именно структурные паттерны, а не конкретные слова и фразы. Он может распознать ИИ-текст даже тогда, когда не может объяснить, какой именно паттерн нашёл — он учится видеть форму рассуждений модели, а не её словарь.
Почему разнообразие аргументов — сложная задача для ИИ
Это глубже, чем вопрос формулировок. Языковые модели обучены производить связный, разумно звучащий текст — и они это делают хорошо. Но «разумно звучащий» означает опору на самые распространённые, самые подкреплённые, самые ожидаемые аргументы из обучающих данных. Модели притягивает к центру: к общепринятому, к каноническому, к хорошо протоптанному. Отдельный человек постоянно выбивается из этого центра — через личный опыт, несогласие с большинством, пробелы в знаниях и просто случайность в подходе к вопросу. У модели такой случайности нет. Её ответы статистически предсказуемее, чем у любого человека — даже когда они звучат абсолютно естественно.
Если создаёшь контент с помощью ИИ, который должен выдержать проверку — для публикации, заявки или чего-то, где детекция ИИ имеет значение — проблема не в роботизированном звучании. Проблема в том, что текст звучит «усреднённо». Заставь модель выдать четыре-пять разных версий одного аргумента, выбери самый неожиданный, перепиши ключевые места сам, и прямо попроси о непопулярных или нестандартных углах. Это не защита на сто процентов, но разбивает кластеризацию.
Практическое следствие работает в двух направлениях. Если ты хочешь определить ИИ-текст — анализ разнообразия аргументов, скорее всего, долговечнее поиска конкретных фраз: фразы легко варьировать, а лежащее в основе распределение аргументов гораздо сложнее изменить без фундаментальной переработки модели. А если хочешь создавать контент, который не срабатывает на детекторах — беглость изложения не спасает. Нужна настоящая непредсказуемость, которая приходит из человеческого суждения, а не из обработки результата ещё одним ИИ.
Pangram работает на рынке, где аутентичность — жёсткое требование: академические работы, журналистика, юридические документы, модерация контента. Инсайт о том, что разнообразие аргументов — это настоящий сигнал, а не поверхностные признаки, — вероятно, долговечнее большинства ранних методов детекции, от которых языковые модели быстро научились уворачиваться. Он работает потому, что бьёт в то, что заложено в способе обучения моделей, а не в то, как они подбирают слова. Сохранится ли это преимущество по мере роста моделей — открытый вопрос. Но пока это самый интересный взгляд на ИИ-детекцию прямо сейчас.
Гайды по теме

Автор
Евгений Арсентьев
PhD · Директор по продукту (CPO) в tech-компании
Хочешь реально это построить?
Гайды объясняют. Бесплатный курс превращает — персонально, с геймификацией и заточенный на быстрый запуск.
◉ Начать бесплатный курсИсточник: the-decoder.com