Якщо ви взагалі бавились із ChatGPT , ви знаєте, яким вражаючим (і жахливим) може бути ШІ. ChatGPT може генерувати майже все, що ви йому запропонуєте, із простими чи складними підказками, які тільки можете придумати. Що ж, Google придумав, як зробити те саме. Але замість того, щоб викидати вірші чи комп’ютерні програми, штучний інтелект Google пише музику, і ви можете переглянути її творіння прямо зараз.
Штучний інтелект Google, який отримав назву MusicLM, створений для створення кількох хвилин високоякісної музики на основі текстових підказок. Хоча ШІ-музика не обов’язково нова, компанія стверджує, що її програма створює треки, які точніше відповідають початковій текстовій підказці. і краща якість, ніж попередні моделі. Великі претензії, звичайно. але, на основі цих попередніх переглядів , вони можуть просто відповідати їм.
Перша партія демонструє, як MusicLM може генерувати музику з розширених субтитрів, подібно до того, як ChatGPT OpenAI генерує свої знамениті відповіді на запити користувачів. Google може надати MusicLM підпис, наприклад, «Основний саундтрек аркадної гри. Він стрімкий і бадьорий, із запальним електрогітарним рифом. Музика повторюється і легко запам’ятовується, але з несподіваними звуками, як-от удари тарілок або дріб барабанів», і ШІ обробить трек, який відповідає цим критеріям.
Мій особистий фаворит із цього розділу – пісня, створена з «Прикольної композиції з сильним, танцювальним ритмом і помітною басовою лінією. Захоплююча мелодія з клавіатури додає пісні насиченості та складності» на другій сторінці, яка звучить як щось із Stardew Valley.
Де дивна долина насправді щоразу, коли Google просить MusicLM створити вокал. У багатьох прикладах Google тут є вокал штучного інтелекту, і хоча деякі з них звучать «комп’ютерно» через відсутність кращого слова, інші звучать надто близько до рідного. Коли ви слухаєте з повним усвідомленням того, що голос на 100% штучний, це трохи тривожить. Google навіть попросив MusicLM створити реп-трек, і, чесно кажучи, «реп» є моторошно реалістичним, навіть якщо жодне зі слів, які вони читають, не є справжнім.
Якщо ви справді хочете, щоб вас лякало, прокрутіть униз до розділу «Текст і мелодія». Тут ви можете почути серію голосів та інструментів, які викладаються з різними мелодіями, і результати неймовірні. У першому варіанті MusicLM наспівує «Bella Ciao», і це звучить спосіб занадто добре. Додаткова примітка: версія «Племінні барабани та флейта» дає White Lotus.
У нас також є «Long Generation», який створює п’ятихвилинні треки з коротких описів, наприклад «мелодійне техно» або «розслаблюючий джаз». Але все стає дуже цікаво з «Режимом історії». Google передає MusicML кілька субтитрів, а штучний інтелект коригує пісню на основі заданих субтитрів. Він починається з 15 секунд на основі «часу для медитації», а потім заголовок змінюється на «час прокидатися». Музика плавно змінюється в мелодії, ніби починає новий куплет, з деякими моторошний вокал для завантаження.
Не дивлячись на моторошний вокал, захоплююче бачити, як штучний інтелект змінює пісню без необхідності змінити пісня. Здебільшого він включає новий підпис до пісні, не відчуваючи, що ви переходите під нову мелодію. Це особливо вражає з третім прикладом, у якому ШІ переходить від «поп-пісні» до «рок-пісні» та «дез-метал». Хоча «рок-пісня» не дуже схожа на рок, «дез-метал» просто фантастична. Я думаю, що AI Death буде великим хітом з металевими головами.
Іншим цікавим експериментом, який Google здійснив, було надання MusicLM описів відомих картин, щоб побачити, яку музику він створить. Якщо ви коли-небудь хотіли знати, як би звучала пісня «Зоряна ніч» Вінсента Ван Гога, тепер у вас є шанс. Також цікаво переглянути, як MusicLM генерує звуки певних інструментів і жанрів. Електрогітара актуальна, як і «Британський інді-рок» із драматичним поворотом у кінці попереднього перегляду.
У цьому обмеженому попередньому перегляді MusicLM є ще багато чого для вивчення, від «Соло на акордеоні» до порівняння різних результатів з одного запиту. Google також опублікував a Дослідження на 15 сторінок на MusicLM, якщо вам цікаво прочитати технічні деталі системи. Хоча я сподіваюся, що компанія випустить бета-версію для громадськості, перегляд цих зразків є наступною найкращою річчю.
[ The Verge ]