Агент Marlin от Sakana работает по 8 часов сам

Sakana AI выпустила Marlin — агента, который без присмотра работает до восьми часов и выдаёт отчёт на 60–100 страниц с источниками и слайдами.

↻ Опубликовано 2026-06-16◷ 5 мин чтенияЕА

Евгений Арсентьев · PhD

Новые посты каждый деньПодпишись на мой TelegramAI-новости и фишки Claude Code — каждый день, первым деломПодписаться →❯_▌ Бесплатный курсНаучись строить это сам — бесплатноБез апсейлов и кросс-сейлов. Здесь нечего купить — просто учись.Начать бесплатный курс →

Sakana AI выпустила Marlin — корпоративного исследовательского агента, который работает без присмотра до примерно восьми часов на одну задачу и выдаёт отчёты на 60–100 страниц с 60–80 указанными источниками плюс презентационные слайды, сгенерированные графической нейросетью. Токийская лаборатория подаёт его как «виртуального директора по стратегии»: за один прогон агент делает сотни-тысячи запросов к моделям, пока сам строит гипотезы, ищет источники и перепроверяет собственные выводы — сжимая то, на что обычно уходят недели, в один долгий сеанс.

Marlin поступил в продажу в июне 2026 года после закрытой беты в апреле, через которую прогнали около 300 профессионалов. Оплата — в кредитах: один прогон стоит 100 кредитов по ¥98 за кредит, тариф Pro — ¥150 000 в месяц (2000 кредитов), Team — ¥400 000 в месяц (6000 кредитов), плюс корпоративные тарифы по запросу.

Почему он работает часами, а не секунды

В основе — метод поиска AB-MCTS (Adaptive Branching Monte Carlo Tree Search). Вместо одного ответа он рассматривает рассуждение как дерево: на каждом шаге решает, идти ли «вширь», породив новый вариант ответа, или «вглубь», уточняя уже найденный удачный. Мульти-модельная версия раскидывает шаги по разным LLM — Sakana называет o4-mini, Gemini 2.5 Pro и DeepSeek-R1 — и решает около 27,5% сложного теста ARC-AGI-2 против 23% у одного o4-mini. Сам алгоритм поиска открыт как TreeQuest под лицензией Apache 2.0 — то есть идею можно взять и без Marlin.

Чем это важно для вас

Большинство ИИ-инструментов отвечают за секунды и ждут, что вы будете направлять каждый шаг. Marlin — из другой категории, которая приходит быстро: агенты, которым задаёшь цель и уходишь на полдня. Это меняет единицу работы — с сообщения в чате на готовый документ, — и меняет узкое место: вопрос уже не «умеет ли модель писать?», а «можно ли доверять восьмидесяти страницам, за созданием которых вы не следили?». Честный ответ сегодня — вслепую нельзя. Мы уже видели, как крупная фирма отозвала отчёт, написанный ИИ, когда выяснилось, что факты в нём выдуманы.

Моё мнение после работы с долгоиграющими агентами: восьмичасовой прогон — это реально и правда полезно для черновика, но ценность появляется, только если относиться к результату как к сырью. Главный подарок здесь — те самые 60–80 источников: это именно то, что можно проверить. Пропустите проверку — и вы просто автоматизировали выпуск уверенных, красиво оформленных ошибок.

!Что бы я сделал

Используйте долгоиграющего агента для черновой работы, а не для вердикта. Прежде чем кто-то начнёт действовать по отчёту в духе Marlin, пройдите по указанным источникам для каждого утверждения, на котором завязано решение, и никогда не пересылайте документ, который не прочитали целиком, только потому что он выглядит готовым.

#agents#sakana#research

Гайды по теме

ЕА

Автор

Евгений Арсентьев

PhD · Директор по продукту (CPO) в tech-компании

Об авторе →

Хочешь реально это построить?

Гайды объясняют. Бесплатный курс превращает — персонально, с геймификацией и заточенный на быстрый запуск.

◉ Начать бесплатный курс

← Все новости

Источник: marktechpost.com