Rebellions бросает вызов Nvidia в ИИ-инференсе

Корейский чипмейкер Rebellions с оценкой более $2,3 млрд бросает вызов Nvidia в инференсе — с чиплетами под агентов и мультимодальные модели.

4 мин чтенияЕАЕвгений АрсентьевЕвгений Арсентьев · PhD

Южнокорейский производитель чипов Rebellions открыто позиционирует себя как прямого конкурента Nvidia в одной конкретной области — ИИ-инференсе, то есть на этапе, когда обученная модель уже работает и отвечает на запрос. Стартап, основанный в 2020 году, привлёк $850 млн, оценивается дороже $2,3 млрд и расширяется на международные рынки. Само название — это и есть заявление: «вот мы, чтобы возглавить одно из восстаний против крупного игрока в этой ИИ-индустрии — Nvidia», — сказал директор по развитию бизнеса Маршалл Чой в выпуске подкаста Targeting AI.

Важно, что Rebellions не пытается обыграть Nvidia во всём. С самого начала компания сосредоточилась только на инференсе, оставив обучение — ту часть, где доминируют GPU Nvidia, — в стороне. «Мы решили, что больше всего пользы принесём, сфокусировавшись на инференсе, чтобы дополнить уже имеющиеся у людей GPU для обучения», — пояснил Чой. Ставка выглядит точной на фоне взлёта агентного ИИ: автономные агенты сильно опираются на инференс, чтобы выбрать следующий шаг, поэтому стоимость и эффективность запуска моделей в продакшене становятся главной цифрой.

Другой подход к чипу

Технически Rebellions делает «чиплеты», а не один большой монолитный процессор: крупный ИИ-чип дробится на мелкие специализированные кремниевые блоки, в которых вычисления и память упакованы в компактный настраиваемый корпус, работающий как нейропроцессор под конкретные задачи — от колл-центров до медицинских систем. Компания также оптимизирует под mixture-of-experts и мультимодальные модели, а не под обычные большие языковые модели, и тесно связана с open-source-сообществом PyTorch. Rebellions — ключевой участник «K-Nvidia», многомиллиардной южнокорейской инициативы по построению суверенитета в ИИ и полупроводниках.

Почему это важно для вас

Сам чип вы никогда не видите, но платите за него. Практически каждый раз, когда чат-бот вам отвечает или ИИ-агент выполняет задачу, эта работа идёт как инференс — и сегодня это почти всегда железо Nvidia, что держит цены высокими, а всю отрасль — в зависимости от одного поставщика. Достойная альтернатива, более дешёвая и эффективная на инференсе, — ровно та конкуренция, что толкает цены на API вниз и снижает риск завязки на единственного вендора. Мне кажется, настоящая борьба в ИИ тихо смещается от «кто обучит самую большую модель» к «кто сможет запускать её достаточно дёшево, чтобы ей было выгодно пользоваться» — и именно эту борьбу выбрал Rebellions. Сможет ли стартап с оценкой $2,3 млрд потеснить компанию, которая в разы крупнее, — вопрос открытый, но даже один серьёзный конкурент в инференсе на руку всем, у кого счёт растёт вместе с нагрузкой.

Что бы я сделал

Не прибивайте проект гвоздями к одной модели или одному провайдеру. Держите промпты и логику в слое, который контролируете сами, чтобы замена базовой модели — или железа, на котором она крутится, — была изменением конфига, а не переписыванием. Когда инференс подешевеет (а конкуренция вроде этой как раз к этому ведёт), вы захотите забрать скидку сразу.

#ai#chips#rebellions#nvidia#inference

Гайды по теме

ЕАЕвгений Арсентьев

Автор

Евгений Арсентьев

PhD · Директор по продукту (CPO) в tech-компании

Хочешь реально это построить?

Гайды объясняют. Бесплатный курс превращает — персонально, с геймификацией и заточенный на быстрый запуск.

◉ Начать бесплатный курс

Источник: aibusiness.com