▌ GitHub-радар

OCR от Baidu: целые PDF за один проход

2026-06-22

Baidu выложил в открытый доступ движок распознавания текста, который обрабатывает многостраничные документы и PDF целиком за один запрос.

Новые посты каждый деньПодпишись на мой TelegramAI-новости и фишки Claude Code — каждый день, первым деломПодписаться →

01baidu/Unlimited-OCR★ 379Python

Unlimited-OCR от Baidu расширяет DeepSeek-OCR для работы с многостраничными документами и PDF за один вызов модели — не нужно подавать страницы по одной. Поддерживает пакетный инференс, стриминговый API и стандартные фреймворки. Почти 400 звёзд за несколько дней с момента публикации.

Зачем это вайб-кодеру

Если вы когда-нибудь пытались вытащить текст из длинного PDF и в итоге разбивали его постранично — этот инструмент решает именно это: один запрос, весь документ, структурированный результат.

Открыть на GitHub →

Ещё находки

2026-06-22

🏆 Топ-5 GitHub за неделю

2026-06-22

Webernetes: Kubernetes прямо в браузере

2026-06-22

Cloudflare выпустил AI-аудит безопасности

Все находки →