banner

blog

Dec 20, 2023

Mãos à obra com a IA do Google

A IA pode retroceder a partir de uma descrição de texto para gerar uma música coerente? Essa é a premissa do MusicLM, a ferramenta de criação de música com inteligência artificial que o Google lançou ontem durante o início de sua conferência I/O.

O MusicLM, que foi treinado em centenas de milhares de horas de áudio para aprender a criar novas músicas em uma variedade de estilos, está disponível para visualização por meio do aplicativo AI Test Kitchen do Google. Eu tenho brincado com isso no último dia, assim como alguns de meus colegas.

O veredito? Digamos que o MusicLM não está vindo para os empregos dos músicos tão cedo.

Usar o MusicLM no Test Kitchen é bastante simples. Assim que o acesso for aprovado, você será recebido com uma caixa de texto onde poderá inserir uma descrição da música - tão detalhada quanto desejar - e fazer com que o sistema gere duas versões da música. Ambos podem ser baixados para ouvir off-line, mas o Google incentiva você a "curtir" uma das faixas para ajudar a melhorar o desempenho da IA.

Créditos da imagem:Google

Quando fiz um cover do MusicLM pela primeira vez em janeiro, antes de ser lançado, escrevi que as músicas do sistema soavam como um artista humano poderia compor - embora não necessariamente musicalmente inventivo ou coeso. Agora, não posso dizer que mantenho totalmente essas palavras, pois parece claro que houve uma escolha séria de amostras do início do ano.

A maioria das músicas que gerei com o MusicLM soa aceitável na melhor das hipóteses - e na pior, como uma criança de quatro anos solta em um DAW. Eu me ative principalmente ao EDM, tentando produzir algo com estrutura e uma melodia perceptível (além de agradável, idealmente). Mas não importa o quão decente - até bom! — o início dos sons das músicas do MusicLM, chega um momento em que elas se quebram de uma forma muito óbvia, musicalmente desagradável.

Por exemplo, pegue esta amostra, gerada usando o prompt "Música EDM em um estilo leve, animado e arejado, bom para dançar". Começa promissor, com uma linha de base balançando a cabeça e elementos de um single clássico do Daft Punk. Mas no meio da faixa, ela desvia muito do curso - praticamente outro gênero.

https://techcrunch.com/wp-content/uploads/2023/05/AI_Test_Kitchen_edm_song_in_a_light_upbeat_and_airy_style_g-2.mp3

Aqui está um solo de piano de um prompt mais simples - "música de piano romântica e emocional". As partes, você notará, soam bem e bem - até mesmo excepcionais, pelo menos em termos do trabalho dos dedos. Mas então é como se o pianista fosse possuído por uma mania. Uma confusão de notas depois, e a música toma uma direção radicalmente diferente, como se fosse uma nova partitura - embora nos moldes do original.

https://techcrunch.com/wp-content/uploads/2023/05/AI_Test_Kitchen_romantic_and_emotional_piano_music.mp3

Eu tentei a mão do MusicLM em chiptunes para o inferno, imaginando que a IA poderia ter mais facilidade com músicas de uma construção mais básica. Sem dados. O resultado (abaixo), embora cativante em partes, terminou tão aleatoriamente quanto as outras amostras.

https://techcrunch.com/wp-content/uploads/2023/05/AI_Test_Kitchen_house_music_in_chiptune_with_an_energetic_ba.mp3

No lado positivo, o MusicLM, em geral, faz um trabalho muito melhor do que o Jukebox, a tentativa da OpenAI há vários anos de criar um gerador de música AI. Em contraste com MusicLM, dado um gênero, artista e um trecho de letra, Jukebox poderia gerar música relativamente coerente completa com vocais, mas as canções produzidas por Jukebox careciam de elementos musicais típicos como refrões que se repetem e muitas vezes continham letras sem sentido. As músicas produzidas pelo MusicLM também contêm menos artefatos e geralmente parecem um passo à frente no que diz respeito à fidelidade.

Além disso, a utilidade do MusicLM é um pouco limitada, graças a limitações artificiais no lado da solicitação. Não gerará música com artistas ou vocais, nem mesmo no estilo de músicos específicos. Tente digitar um prompt como "ao longo das linhas de Barry Manilow" e você não receberá nada além de uma mensagem de erro.

Créditos da imagem:Google

COMPARTILHAR