Esta semana, os pesquisadores do Google publicaram um artigo descrevendo os resultados de um inteligência artificial (AI) ferramenta construída para criar música.
A ferramenta, chamada MusicLM, não é a primeira ferramenta de música AI a ser lançada. Mas os exemplos fornecidos pelo Google demonstram capacidade criativa musical com base em um conjunto limitado de palavras descritivas.
A IA mostra como sistemas de computador complexos foram treinados para se comportar de maneira semelhante à humana.
Ferramentas como o ChatGPT podem produzir ou gerar rapidamente documentos escritos que se comparam bem com o trabalho de humanos. O ChatGPT e sistemas semelhantes requerem computadores poderosos para operar modelos complexos de aprendizado de máquina. A empresa OpenAI, com sede em San Francisco, lançou o ChatGPT no final do ano passado.
Os desenvolvedores treinam esses sistemas em grandes quantidades de dados para aprender métodos de criação de diferentes formas de conteúdo. Por exemplo, o conteúdo gerado por computador pode incluir material escrito, elementos de design, arte ou música.
O ChatGPT recentemente recebeu muita atenção por sua capacidade de gerar textos complexos e outros conteúdos a partir de uma simples descrição em linguagem natural.
MusicLM do Google
Os engenheiros do Google explicam o sistema MusicLM desta maneira:
Primeiro, um usuário apresenta uma palavra ou palavras que descrevem o tipo de música que deseja que a ferramenta crie.
Por exemplo, um usuário pode inserir esta frase curta no sistema: “um violino calmante contínuo apoiado por um som suave de guitarra”. As descrições inseridas podem incluir diferentes músicas estilosinstrumentos ou outros sons existentes.
Vários exemplos de músicas diferentes produzidos pela MusicLM foram publicados online. Algumas das músicas geradas vieram de descrições de apenas uma ou duas palavras, como “jazz”, “rock” ou “techno”. O sistema criou outros exemplos a partir de descrições mais detalhadas contendo frases inteiras.
Em um exemplo, os pesquisadores do Google incluem esses instruções para MusicLM: “A trilha sonora principal de um videogames jogos. É um ritmo acelerado e otimista, com um riff cativante de guitarra elétrica. a musica é repetitivo e fácil de lembrar, mas com sons inesperados…”
Na gravação resultante, a música parece estar muito próxima da descrição. A equipe disse que quanto mais detalhada for a descrição, melhor o sistema pode tentar produzi-la.
O modelo MusicLM opera de maneira semelhante aos sistemas de aprendizado de máquina usados pelo ChatGPT. Essas ferramentas podem produzir resultados semelhantes aos humanos porque são treinadas em grandes quantidades de dados. Muitos materiais diferentes são alimentados nos sistemas para permitir que eles aprendam habilidades complexas para criar obras realistas.
Além de gerar novas músicas a partir de descrições escritas, a equipe disse que o sistema também pode criar exemplos baseados no próprio canto de uma pessoa, cantarolandoassobiando ou tocando um instrumento.
Os pesquisadores disseram que a ferramenta “produz música de alta qualidade… fiel ao sinal de condicionamento de texto.”
No momento, a equipe do Google não liberou os modelos MusicLM para uso público. Isso difere do ChatGPT, que foi disponibilizado online para os usuários experimentarem em novembro.
No entanto, o Google anunciou que estava lançando um “conjunto de dados de alta qualidade” de mais de 5.500 pares de composições musicais preparados por músicos profissionais chamados MusicCaps. Os pesquisadores deram esse passo para ajudar no desenvolvimento de outros geradores de música de IA.
Os pesquisadores do MusicLM disseram que acreditam ter desenvolvido uma nova ferramenta para ajudar qualquer pessoa a criar seleções musicais de alta qualidade de maneira rápida e fácil. No entanto, a equipe disse que também reconhece alguns riscos ligados ao processo de aprendizado de máquina.
Um dos maiores problemas que os pesquisadores identificaram foram os “vieses presentes nos dados de treinamento”. Um viés pode incluir muito de um lado e não o suficiente do outro. Os pesquisadores disseram que isso levanta uma questão “sobre adequação para geração de música para culturas sub-representadas nos dados de treinamento.”
A equipe disse que planeja continuar a estudar quaisquer resultados do sistema que possam ser considerados apropriação cultural. O objetivo seria limitar os vieses por meio de mais desenvolvimento e testes.
Além disso, os pesquisadores disseram que planejam continuar melhorando o sistema para incluir geração de letras, condicionamento de texto e melhor qualidade de voz e música.
Eu sou Bryan Lynn.
Bryan Lynn escreveu esta história para VOA Learning English, com base em relatórios do Google.
____________________________________________________________
Palavras nesta história
inteligência artificial – n. O desenvolvimento de sistemas de computador que têm a capacidade de realizar trabalhos que normalmente requerem inteligência humana
estilo -n. uma forma ou design particular, geralmente usado na comparação de formas de arte ou trabalho manual
instrução -n. uma descrição de como fazer algo
videogames – n. uma área contendo muitos jogos eletrônicos e outros jogos operados por moedas
otimista – adj. cheio de esperança e felicidade
repetitivo – adj. dizer ou fazer algo repetidamente
zumbir – v. fazer um som musical sem abrir a boca
apito -v. para fazer um som alto, forçando o ar através de um pequeno orifício na boca
fiel – adj. manter-se firme sobre uma ideia ou crença
apropriado – adj. o nível em que algo é certo para uma situação
apropriação cultural – n. Quando os membros de uma cultura em uma sociedade, muitas vezes a cultura principal, usam uma prática de outra cultura, muitas vezes minoritária, sem entender completamente o significado ou a importância da prática.
____________________________________________________________
O que você acha dessa história? Nós queremos ouvir de você. Temos um novo sistema de comentários. Aqui está como funciona:
- Escreva seu comentário na caixa.
- Abaixo da caixa, você pode ver quatro imagens para contas de mídia social. Eles são para Disqus, Facebook, Twitter e Google.
- Clique em uma imagem e uma caixa aparecerá. Insira o login da sua conta de mídia social. Ou você pode criar um no sistema Disqus. É o círculo azul com “D” nele. É de graça.
Cada vez que você retornar a um comentário no site Learning English, poderá usar sua conta e ver seus comentários e respostas a eles. Nossa política de comentários é aqui.
.