ИИ Meta уже решает половину вопросов модерации постов

ИИ Meta выносит половину решений по модерации контента, к концу 2026-го — цель 90%. Но собственные сотрудники предупреждают: темп слишком быстрый.

5 мин чтенияЕАЕвгений АрсентьевЕвгений Арсентьев · PhD

Половина всех решений о модерации контента в Meta теперь принимается не человеком, а языковой моделью. Такого масштаба AI-модерация достигла уже в 2025 году — и компания не останавливается. К концу 2026-го Meta планирует превысить 90% хотя бы для части категорий постов. Платформа, где каждый день происходят миллиарды взаимодействий, передаёт исполнение собственных правил искусственному интеллекту.

Собственная статистика компании выглядит убедительно: ИИ-модели допускают на 13% меньше ошибок, чем люди, и выявляют на 10% больше нарушений — с марта, когда начались боевые тесты. Часть выигрыша приходит там, где языковые модели действительно работают лучше жёстких систем правил: сатира, меняющийся сленг, контекстно зависимый смысл — всё это давало сбои раньше. Meta также переключила основу с Google Gemini на собственную модель Muse Spark.

Сотрудники бьют тревогу

Но эти цифры — данные самой Meta. Сотрудники, говорящие журналистам, предупреждают: развёртывание идёт слишком быстро, без достаточного времени, чтобы поймать нештатные ситуации до того, как они затронут реальных пользователей. Модели, по их словам, по-прежнему удаляют и скрывают контент, который не нарушает никаких правил. Когда платформа работает в масштабе миллиардов пользователей, даже небольшой процент ошибок превращается в миллионы людей, чьи посты исчезают без объяснений.

За переходом стоит и финансовый мотив, который Meta не торопится признавать главным. Замена людей-модераторов на ИИ должна сэкономить компании миллиарды долларов в год — и увольнения среди подрядчиков уже ускоряются. Meta говорит о качестве, аналитики говорят о затратах. Обе версии верны одновременно.

Что происходит, когда ИИ становится судьёй

Но главная история здесь шире Meta. Это живой пример того, что происходит, когда ИИ-системы принимают решения о том, что миллиарды людей могут или не могут говорить в интернете. Ошибки модерации — это не абстракция: они заглушают активистов, стирают сатиру, уничтожают историческую документацию. Когда человек-модератор ошибается, есть апелляция и коррекция. Когда ИИ-модель систематически ошибается при 90%-ном охвате, петля обратной связи работает иначе — медленнее всплывает, сложнее отследить, шире по последствиям.

Для тех, кто строит AI-продукты, этот кейс наглядно показывает разрыв между хорошими показателями на тестах и реальным поведением. Модель, которая в среднем на 13% точнее, может систематически ошибаться в конкретных категориях. При достаточном масштабе «конкретные категории» — это миллионы затронутых решений в день. Поэтапное развёртывание, мониторинг ошибок с выборочной проверкой людьми и чёткий путь исправлений — это именно то, о чём говорят критики внутри Meta.

Что бы я сделал

Если вы строите что-то, где ИИ принимает важные решения — проверяет контент, помечает пользователей, маршрутизирует запросы — сделайте мониторинг ошибок частью архитектуры с самого начала. Выборочно проверяйте часть AI-решений живым человеком, отслеживайте, где модель ошибается, и выстройте чёткий путь для апелляций. Сотрудники Meta поднимают этот вопрос в масштабе миллиарда пользователей — та же логика работает, если ваша система принимает тысячу решений в день.

#meta#moderation#ai-deployment#safety#llm

Гайды по теме

ЕАЕвгений Арсентьев

Автор

Евгений Арсентьев

PhD · Директор по продукту (CPO) в tech-компании

Хочешь реально это построить?

Гайды объясняют. Бесплатный курс превращает — персонально, с геймификацией и заточенный на быстрый запуск.

◉ Начать бесплатный курс

Источник: the-decoder.com