Mistral OCR 4: 93% точность, 170 языков, свой сервер
Mistral выпустила OCR 4 — лидер всех главных тестов на извлечение данных из документов. Поддерживает 170 языков, оценивает уверенность на уровне каждого слова.
Евгений Арсентьев · PhDMistral выпустила OCR 4 — модель для понимания и извлечения данных из документов. На OmniDocBench, главном отраслевом тесте по качеству распознавания, она набрала 93,07 из 100. На OlmOCRBench — 85,20, лучший показатель в своём классе. В независимых сравнительных тестах живые аннотаторы предпочли OCR 4 в 72% случаев.
Это не просто строчки в таблице рейтингов. Распознавание документов — один из самых неудобных и при этом редко обсуждаемых тормозов при создании AI-продуктов. PDF с таблицами, формулами, смешанным форматированием и рукописными пометками регулярно ломают обычные инструменты — а когда ломается извлечение, всё дальнейшее тоже ломается.
Что OCR 4 делает иначе
Модель не просто переводит изображение в текст — она читает структуру документа. Определяет тип каждого блока: это заголовок, абзац, таблица, формула или подпись. Фиксирует точное расположение каждого элемента на странице. И для каждого слова и каждой страницы выдаёт оценку уверенности — число, которое показывает, насколько модель уверена в своём прочтении.
Именно эта оценка уверенности меняет практическую математику автоматизации. Если ты строишь систему для проверки договоров или обработки счетов, сейчас стоишь перед жёстким выбором: смириться с определённым процентом ошибок или проверять всё вручную. Оценки уверенности дают третий вариант: автоматически принимать уверенные результаты и направлять на ручную проверку только помеченные фрагменты. Вот как реально автоматизировать обработку документов без потери надёжности.
OCR 4 поддерживает 170 языков в десяти языковых группах, включая редкие — арабский, индийские письменности, восточноазиатские языки, — где большинство моделей начинают ошибаться особенно часто.
Цены и где запускать
Доступ через API стоит $4 за 1 000 страниц через Mistral Studio. Пакетный API — $2 за 1 000 страниц, вдвое дешевле, когда не нужен мгновенный результат. OCR 4 также доступна на Amazon SageMaker и Microsoft Foundry, поддержка Snowflake — скоро.
Опция, которую стоит рассмотреть отдельно, — локальная установка: OCR 4 поставляется как единый контейнер, который запускается на твоём сервере. Никаких облачных подписок, никакой передачи файлов вовне и никаких расходов за страницу после первоначальной настройки. Для договоров, финансовых документов, медицинских записей и всего, что нельзя отправлять в сторонние сервисы, — это не дополнительная опция, а единственно возможный вариант.
Если строишь что-то, где надо читать PDF — договоры, формы, счета — попробуй OCR 4 через Mistral Studio на самых сложных документах. Обрати внимание на оценку уверенности: она сразу покажет, каким частям результата можно доверять, а какие стоит перепроверить вручную. Для чувствительных данных, которые нельзя отдавать на сторону, — локальная установка реально стоит рассмотрения.
Гайды по теме

Автор
Евгений Арсентьев
PhD · Директор по продукту (CPO) в tech-компании
Хочешь реально это построить?
Гайды объясняют. Бесплатный курс превращает — персонально, с геймификацией и заточенный на быстрый запуск.
◉ Начать бесплатный курсИсточник: mistral.ai