DeepSeek ускорил модели на 85% — без новых чипов
DeepSeek выпустила DSpark — MIT-фреймворк для ускорения ИИ: скорость ответа растёт на 60–85%, пропускная способность в тестах — до 661%. Стратегический ответ на американские ограничения экспорта чипов.
Евгений Арсентьев · PhDDeepSeek выпустила DSpark — открытый фреймворк под лицензией MIT для ускорения вывода (inference) ИИ-моделей. Принцип работы: маленькая вспомогательная модель предлагает варианты ответа пачками, большая — проверяет их все разом вместо обработки слов по одному. Дополнительно система генерирует небольшие группы токенов и корректирует нагрузку в зависимости от уверенности в ответах.
Результаты тестов: скорость ответа для конечного пользователя растёт на 60–85%, а суммарная пропускная способность (количество запросов в единицу времени) в тестах на моделях Gemma от Google и Qwen от Alibaba прибавила до 661%. DSpark уже доступен на GitHub и Hugging Face.
США ужесточают экспортный контроль над передовыми чипами, пытаясь ограничить вычислительные мощности Китая в ИИ. DSpark меняет уравнение: каждый процент эффективности сокращает зависимость от американского оборудования. Технологический разрыв сужается не за счёт новых чипов, а за счёт умного кода — и это доступно любой стране с ограниченным доступом к топовым GPU.
Гайды по теме

Автор
Евгений Арсентьев
PhD · Директор по продукту (CPO) в tech-компании
Хочешь реально это построить?
Гайды объясняют. Бесплатный курс превращает — персонально, с геймификацией и заточенный на быстрый запуск.
◉ Начать бесплатный курсИсточник: the-decoder.com