Миллионы песен ушли на обучение ИИ-музыки

The Atlantic выложил базы, по которым видно: десятки миллионов треков — включая Тейлор Свифт и Bad Bunny — попали в обучение ИИ-генераторов Suno и Udio.

5 мин чтенияЕАЕвгений АрсентьевЕвгений Арсентьев · PhD

Многие миллионы записанных песен — от Тейлор Свифт до Bad Bunny — были использованы для обучения ИИ-генераторов музыки без разрешения артистов. Об этом говорится в расследовании, которое The Atlantic опубликовал 15 июня. Издание выложило четыре поисковые базы с этим материалом: в крупнейшей — 12 миллионов треков, во второй — 9 миллионов, ещё в двух — примерно по 100 тысяч песен. Среди инструментов, обученных на этих данных, называют Suno, Udio и модели Google.

Материал штатного автора Алекса Райснера — музыкальный аналог тех расследований про сканирование книг, что то же издание делало раньше, только масштаб тут больше, а каталог узнаваемее. В базах не просто безвестные демки; они дотягиваются до коммерческого каталога, который стриминги продают каждый день. Suno и Udio уже судятся с крупными лейблами за нарушение авторских прав, и обе компании опираются на защиту «добросовестным использованием» — тот самый аргумент, вокруг которого идут суды по всей ИИ-индустрии.

Почему это важно за пределами судов

Юридические ставки совсем не абстрактны. Параллельная тяжба об авторских правах в книгоиздании привела к мировому соглашению на 1,5 миллиарда долларов с участием Anthropic — это даёт представление о суммах, за которыми пойдут лейблы. Но то, что касается обычного слушателя, тише: ИИ-треки, обученные на реальных артистах, начинают конкурировать с этими же артистами внутри ваших плейлистов. Стриминги это заметили — Spotify тестирует инструменты для управления ИИ-контентом, Deezer сделал детектор ИИ-музыки, а Apple Music помечает ИИ-треки, когда дистрибьютор это указывает, — но меры пока ранние и неровные и не мешают недобросовестным игрокам клонировать стиль певца по запросу.

Это расследование полезно, а не просто тревожно, потому что превращает расплывчатое опасение в проверяемый факт. Раньше артист, подозревавший, что его каталог проглотила модель, никак не мог это подтвердить; поисковый список это меняет — и именно такое доказательство переводит дело об авторских правах из «мы думаем» в «вот оно». Моя единственная честная оценка: индустрия два года спорила, происходит ли это вообще, а продуктивный вопрос теперь — на каких условиях это лицензировать, потому что данные уже внутри моделей, и никакое соглашение их не «разучит».

Что бы я сделал

Если вы делаете музыку — первым делом поищите своё имя в этих базах: конкретное доказательство стоит больше, чем возмущение, и именно с ним могут работать лейблы и юристы. Если вы только слушаете — заведите привычку проверять метку артиста на треке, прежде чем добавить его в плейлист; пометки «сгенерировано ИИ» несовершенны, но это первая практическая граница между песней, которую написал человек, и той, что модель собрала из миллионов украденных.

#ai#music#copyright#suno#udio#legal

Гайды по теме

ЕАЕвгений Арсентьев

Автор

Евгений Арсентьев

PhD · Директор по продукту (CPO) в tech-компании

Хочешь реально это построить?

Гайды объясняют. Бесплатный курс превращает — персонально, с геймификацией и заточенный на быстрый запуск.

◉ Начать бесплатный курс

Источник: engadget.com