Новый API Gemini: агенты, фоновые задачи, медиа
Google переключила Gemini на Interactions API. Все новые функции агентов — фоновые задачи, Linux-окружение, медиагенерация — только здесь.
Евгений Арсентьев · PhDGoogle DeepMind перевела Interactions API из беты (декабрь 2025) в статус стандартного интерфейса Gemini — с июня 2026 года он везде по умолчанию: в Google AI Studio и во всей документации. Прежний стандарт, generateContent, продолжит работать для существующего кода. Но Google провела чёткую черту: все новые функции агентов отныне выходят исключительно через Interactions API. Если ваш проект строится на новых возможностях Gemini — оставаться на старом API означает оставаться замороженным.
Принципиальное отличие двух API — в том, как описываются взаимодействия. В generateContent всё строилось по ролям: сообщения получали метку «user» или «model». В Interactions API — по типам шагов: каждое действие (ввод пользователя, вызов инструмента, результат функции, ответ модели) — отдельный шаг со своим типом. Для обычного чата разница почти незаметна. Для агентных цепочек с несколькими инструментами типизированные шаги делают логику заметно проще для описания и расширения.
Что открывает новый API
Возможности, доступные только через Interactions API, существенные. Управляемые агенты с Linux-окружением: не симуляция вызова инструмента, а настоящий шелл в изолированной среде — агент может запускать команды как в реальном терминале. Фоновое выполнение: задача продолжает работу после завершения запроса, агент трудится часами — вы запускаете и забираете результат, когда готово. Цепочки с Google Search и Maps — встроенный шаг в той же схеме ответа, а не внешний вызов, который нужно подключать отдельно. Генерация медиа (изображения, музыка, речь) — как нативный тип вывода внутри того же ответа, без обращения к отдельным сервисам.
Есть и ценовая сторона. Interactions API вводит два режима работы. Flex стоит 50% от стандартной цены, но работает на менее приоритетных вычислениях — подходит для фоновых и пакетных задач, где время ответа не критично. Priority — полная скорость по стандартной цене, для агентов в реальном времени, где медленный ответ ломает опыт. Для всего, что работает в фоне без ваших глаз на экране, Flex может вдвое снизить расходы без потери результата.
Если вы строите на Gemini — миграция с generateContent на Interactions API стоит того, чтобы сделать её сейчас, не ждать потолка. Google опубликовала руководство по миграции в документации Google AI Studio. Две функции, которые больше всего меняют практику: фоновое выполнение для задач, которые работают без вашего присутствия, и агенты с настоящим Linux-шеллом — в старом API их нет физически. И сразу разберитесь с режимами Flex и Priority: для пакетных задач разница в цене ощутима.
Гайды по теме

Автор
Евгений Арсентьев
PhD · Директор по продукту (CPO) в tech-компании
Хочешь реально это построить?
Гайды объясняют. Бесплатный курс превращает — персонально, с геймификацией и заточенный на быстрый запуск.
◉ Начать бесплатный курсИсточник: the-decoder.com