▌ GitHub-радар

OCR от Baidu: целые PDF за один проход

Baidu выложил в открытый доступ движок распознавания текста, который обрабатывает многостраничные документы и PDF целиком за один запрос.

01baidu/Unlimited-OCR 379Python

Unlimited-OCR от Baidu расширяет DeepSeek-OCR для работы с многостраничными документами и PDF за один вызов модели — не нужно подавать страницы по одной. Поддерживает пакетный инференс, стриминговый API и стандартные фреймворки. Почти 400 звёзд за несколько дней с момента публикации.

Зачем это вайб-кодеру

Если вы когда-нибудь пытались вытащить текст из длинного PDF и в итоге разбивали его постранично — этот инструмент решает именно это: один запрос, весь документ, структурированный результат.

Открыть на GitHub →