▌ GitHub-радар
OCR от Baidu: целые PDF за один проход
Baidu выложил в открытый доступ движок распознавания текста, который обрабатывает многостраничные документы и PDF целиком за один запрос.
Unlimited-OCR от Baidu расширяет DeepSeek-OCR для работы с многостраничными документами и PDF за один вызов модели — не нужно подавать страницы по одной. Поддерживает пакетный инференс, стриминговый API и стандартные фреймворки. Почти 400 звёзд за несколько дней с момента публикации.
Зачем это вайб-кодеру
Если вы когда-нибудь пытались вытащить текст из длинного PDF и в итоге разбивали его постранично — этот инструмент решает именно это: один запрос, весь документ, структурированный результат.
Ещё находки