В 1000 раз экономнее: новый вид ИИ-компьютера

Навин Рао из Databricks основал Unconventional AI — стартап, чья демо-система Un0 заявляет расход энергии на инференс в 1000 раз меньше обычного GPU.

4 мин чтенияЕАЕвгений АрсентьевЕвгений Арсентьев · PhD

Навин Рао, несколько лет руководивший направлением AI в Databricks, основал компанию Unconventional AI и представил её первый рабочий продукт: систему генерации изображений Un0, работающую на принципиально иной архитектуре — осциллятор-основанной. Главное заявление: потребление энергии при инференсе (это момент, когда модель отвечает на запрос) снижается в 1000 раз по сравнению с обычными GPU-системами.

Демо работает в программной симуляции — реального чипа пока нет. Рао объявил, что схемы железа вскоре будут опубликованы. Результаты генерации изображений уже реальны, и, по его словам, Un0 сопоставим с современными диффузионными моделями. В компании меньше 50 сотрудников.

Почему энергия стала главным потолком ИИ

Каждые несколько месяцев появляется новое поколение моделей — мощнее прежнего, и каждое требует больше вычислений. Больше вычислений — больше электричества. Дата-центры уже перегружают энергосети в разных частях мира. Рао формулирует прямо: «ИИ-масштабирование тяжело потому, что оно ограничено энергией». Вопрос не в том, существует ли этот потолок — а в том, как скоро в него упрутся.

Ответ Unconventional AI — переосмыслить сам чип. Обычные процессоры и GPU используют транзисторы, которые переключаются между двумя состояниями: выключено и включено. Осциллятор-архитектура работает иначе: через непрерывно осциллирующие сигналы, которые несут больше информации при меньших затратах энергии. Команда Рао построила программную симуляцию этой архитектуры и натренировала на ней Un0. «Это hello world нового вида компьютера», — сказал он.

За чем следить

Заявление о 1000x — исключительно громкое, а железные дорожные карты регулярно сдвигаются. Но логика ставки здравая: первыми почувствуют нехватку энергии не гиперскейлеры с прямыми договорами на электроэнергию, а компании и билдеры, которые платят за каждый вызов модели и не могут остановить рост счетов. Если осциллятор-чипы когда-нибудь перейдут от схем к кремнию — первым применением, почти наверняка, станет именно инференс: та часть, которая срабатывает каждый раз, когда кто-то отправляет запрос модели.

Для контекста: главная причина, по которой API-инференс дешевеет последние два года — постепенное улучшение эффективности чипов. Несколько процентов тут, новый вариант архитектуры там. Настоящий прыжок на порядок величины, а тем более на три порядка, изменил бы математику настолько полностью, что за этим стоит следить даже на стадии симуляции.

Что бы я сделал

Поставьте закладку на момент, когда Unconventional AI опубликует схемы чипов. Если они окажутся технически состоятельными — проверены людьми, которые реально производят железо, — движение цен на инференс может пойти в совершенно другую сторону. Пока демо берёт один барьер: архитектура умеет генерировать изображения в симуляции. Это ещё далеко до производства чипов, но это уже реальный шаг.

#ai#hardware#energy#startups#inference

Гайды по теме

ЕАЕвгений Арсентьев

Автор

Евгений Арсентьев

PhD · Директор по продукту (CPO) в tech-компании

Хочешь реально это построить?

Гайды объясняют. Бесплатный курс превращает — персонально, с геймификацией и заточенный на быстрый запуск.

◉ Начать бесплатный курс

Источник: techcrunch.com