Стартап заявил, что пробил давнее узкое место ИИ

Стартап Subquadratic из Майами уверяет, что его модель SubQ обходит квадратное узкое место трансформеров — 56× быстрее, 12 млн токенов, — но эксперты ждут доказательств.

↻ Опубликовано 2026-06-19◷ 4 мин чтенияЕА

Евгений Арсентьев · PhD

Новые посты каждый деньПодпишись на мой TelegramAI-новости и фишки Claude Code — каждый день, первым деломПодписаться →Бесплатный курс по Claude CodeБез апсейлов и кросс-сейлов — здесь нечего купить.Начать →

Subquadratic, стартап из Майами, вышедший из режима стелс в мае 2026 года, заявляет, что его модель SubQ пробивает квадратное узкое место механизма внимания, которое сдерживало большие языковые модели почти десять лет. Громкие цифры, о которых пишет MIT Technology Review, впечатляют: до 56 раз быстрее моделей на FlashAttention, окно контекста до 12 млн токенов и 98% точности на поиске «иголки в стоге сена» при масштабе от 6 до 12 млн токенов.

Узкое место реальное и давнее. В обычном трансформере внимание «плотное» — каждый токен сравнивается с каждым другим, поэтому удвоение длины текста увеличивает вычисления примерно вчетверо. Из-за этой квадратной стоимости длинные документы быстро дорожают, а у окон контекста есть практический предел. SubQ вместо этого использует разреженное внимание: динамический, привязанный к тексту механизм, который выбирает только значимые связи между токенами, а не перемалывает каждую пару. Основанная техдиректором Алексом Уэдоном и гендиректором Джастином Дэнгелом, компания говорит, что именно этот сдвиг и даёт скорость и длину.

Цифры — и звёздочки к ним

По стоимости заявление яркое: прогон бенчмарка RULER 128 обошёлся компании в $8 против $2600, которые она приводит для Opus 4.6 от Anthropic. SubQ также показал 89,7% на LiveCodeBench, тесте по соревновательному программированию, и, по сообщениям, разобрал задачу с анализом 400 документов за секунды. Независимый оценщик Appen провёл тесты; его директор Жанин Синанан-Сингх сказала, что архитектура «может стать переломной».

А теперь звёздочки. Публичный доступ скудный — несмотря на заявленные десятки тысяч заявок, есть длинный лист ожидания, так что почти никто извне модель толком не нагружал. SubQ переиспользовал веса из открытой китайской модели Qwen, а не обучался с нуля, что усложняет честные сравнения. А ИИ-исследователь Уилл Депью прямо сформулировал позицию скептика: «публичных доказательств пока недостаточно, чтобы утверждать, что они решили проблему квадратного внимания». Бенчмарки, как всегда, не равны реальному использованию на пёстрых и разных задачах.

ℹЧто бы я сделал

Не перекраивай планы под SubQ прямо сейчас — дождись независимого доступа и сторонних цифр на задачах, которые важны тебе. Но направление возьми на заметку: разреженное, избирательное внимание — туда движется значительная часть отрасли, и дешёвый длинный контекст придёт, окажется этот конкретный стартап тем самым или нет.

Почему это важно, даже если ты никогда не коснёшься SubQ: квадратная стена — это причина, по которой нынешние модели забывают начало длинного разговора, давятся целой кодовой базой или берут реальные деньги за чтение длинного PDF. Пробей эту стену дёшево — и куча раздражающих ограничений тихо ослабнет: можно было бы дать модели целую книгу, годовую переписку или огромный репозиторий и чтобы она действительно держала всё это в голове. Моё честное ощущение: заявления захватывающие, а оговорки не менее серьёзные, и правильная позиция — заинтересованно, но без веры, пока модель не смогут запустить независимые люди. Настоящий прорыв здесь значил бы огромно много — именно поэтому он заслуживает больше доказательств, чем бенчмарк-лист в неделю запуска.

#llm#attention#long-context

Гайды по теме

ЕА

Автор

Евгений Арсентьев

PhD · Директор по продукту (CPO) в tech-компании

Об авторе →

Хочешь реально это построить?

Гайды объясняют. Бесплатный курс превращает — персонально, с геймификацией и заточенный на быстрый запуск.

◉ Начать бесплатный курс

← Все новости

Источник: technologyreview.com