▌ GitHub-радар
Boogu-Image: открытый генератор картинок, догоняющий закрытые
Boogu-Image — полностью открытое (Apache-2.0) семейство моделей для генерации и редактирования изображений, которое обещает качество на уровне коммерческих при куда меньшем объёме обучающих данных. Есть три версии: базовая, быстрая Turbo на 4 шага и Edit для переделки готовых картинок.
Boogu-Image — открытое семейство моделей (лицензия Apache-2.0) для генерации и редактирования изображений на PyTorch. Поставляется в трёх вариантах: базовая модель с упором на разнообразие и плотный, читаемый текст на картинке; дистиллированная Turbo, дающая фотореалистичный результат всего за четыре шага; и Edit для изменений и трансформаций по принципу «картинка в картинку». Модель умеет рисовать текст на китайском и английском внутри изображения, а команда выложила сравнение «Boogu Arena», где она держится в конкурентном диапазоне ELO против ведущих коммерческих систем. Главное заявление — качество, близкое к закрытым моделям, при на порядок меньшем объёме данных. За первую неделю проект набрал почти 400 звёзд.
Зачем это вайб-кодеру
Большинство сильных генераторов картинок заперты за платными сервисами, куда не заглянешь и которые не запустишь по-своему. Открытая модель, которую можно скачать и поднять у себя, — это отсутствие платы за каждую картинку, полный контроль над данными и свобода её дорабатывать. Если заявленное качество подтвердится, Boogu-Image — как раз тот релиз, что позволяет разработчикам и энтузиастам встроить мощный генератор картинок прямо в свои приложения и процессы.
Ещё находки