Агент Marlin от Sakana работает по 8 часов сам
Sakana AI выпустила Marlin — агента, который без присмотра работает до восьми часов и выдаёт отчёт на 60–100 страниц с источниками и слайдами.
Евгений Арсентьев · PhDSakana AI выпустила Marlin — корпоративного исследовательского агента, который работает без присмотра до примерно восьми часов на одну задачу и выдаёт отчёты на 60–100 страниц с 60–80 указанными источниками плюс презентационные слайды, сгенерированные графической нейросетью. Токийская лаборатория подаёт его как «виртуального директора по стратегии»: за один прогон агент делает сотни-тысячи запросов к моделям, пока сам строит гипотезы, ищет источники и перепроверяет собственные выводы — сжимая то, на что обычно уходят недели, в один долгий сеанс.
Marlin поступил в продажу в июне 2026 года после закрытой беты в апреле, через которую прогнали около 300 профессионалов. Оплата — в кредитах: один прогон стоит 100 кредитов по ¥98 за кредит, тариф Pro — ¥150 000 в месяц (2000 кредитов), Team — ¥400 000 в месяц (6000 кредитов), плюс корпоративные тарифы по запросу.
Почему он работает часами, а не секунды
В основе — метод поиска AB-MCTS (Adaptive Branching Monte Carlo Tree Search). Вместо одного ответа он рассматривает рассуждение как дерево: на каждом шаге решает, идти ли «вширь», породив новый вариант ответа, или «вглубь», уточняя уже найденный удачный. Мульти-модельная версия раскидывает шаги по разным LLM — Sakana называет o4-mini, Gemini 2.5 Pro и DeepSeek-R1 — и решает около 27,5% сложного теста ARC-AGI-2 против 23% у одного o4-mini. Сам алгоритм поиска открыт как TreeQuest под лицензией Apache 2.0 — то есть идею можно взять и без Marlin.
Чем это важно для вас
Большинство ИИ-инструментов отвечают за секунды и ждут, что вы будете направлять каждый шаг. Marlin — из другой категории, которая приходит быстро: агенты, которым задаёшь цель и уходишь на полдня. Это меняет единицу работы — с сообщения в чате на готовый документ, — и меняет узкое место: вопрос уже не «умеет ли модель писать?», а «можно ли доверять восьмидесяти страницам, за созданием которых вы не следили?». Честный ответ сегодня — вслепую нельзя. Мы уже видели, как крупная фирма отозвала отчёт, написанный ИИ, когда выяснилось, что факты в нём выдуманы.
Моё мнение после работы с долгоиграющими агентами: восьмичасовой прогон — это реально и правда полезно для черновика, но ценность появляется, только если относиться к результату как к сырью. Главный подарок здесь — те самые 60–80 источников: это именно то, что можно проверить. Пропустите проверку — и вы просто автоматизировали выпуск уверенных, красиво оформленных ошибок.
Используйте долгоиграющего агента для черновой работы, а не для вердикта. Прежде чем кто-то начнёт действовать по отчёту в духе Marlin, пройдите по указанным источникам для каждого утверждения, на котором завязано решение, и никогда не пересылайте документ, который не прочитали целиком, только потому что он выглядит готовым.
Гайды по теме

Автор
Евгений Арсентьев
PhD · Директор по продукту (CPO) в tech-компании
Хочешь реально это построить?
Гайды объясняют. Бесплатный курс превращает — персонально, с геймификацией и заточенный на быстрый запуск.
◉ Начать бесплатный курсИсточник: marktechpost.com