Meta lança AudioCraft: gerador de música com IA
3 min de leituraMeta lança AudioCraft: gerador de música com IA com código-fonte aberto
A Meta anunciou recentemente a disponibilidade do AudioCraft, uma suíte de ferramentas de AI generativa de código aberto para criação de música e áudio a partir de prompts de texto. Com essa inovadora ferramenta, criadores de conteúdo podem inserir descrições simples para gerar paisagens sonoras complexas, compor melodias e até simular orquestras virtuais completas.
As Três Ferramentas Principais do AudioCraft
O AudioCraft é composto por três componentes essenciais:
- AudioGen: Uma ferramenta capaz de gerar diversos efeitos sonoros e paisagens sonoras.
- MusicGen: Pode criar composições musicais e melodias a partir de descrições.
- EnCodec: Um codec de compressão de áudio baseado em redes neurais.
Avanços Notáveis
Mais especificamente, é notável o refinamento do EnCodec, desenvolvido pela Meta, que culminou em uma aperfeiçoada capacidade de “gerar composições musicais de qualidade superior com uma redução significativa de artefatos”. Em paralelo, o AudioGen demonstra sua versatilidade ao produzir efeitos sonoros que variam desde o latido de um cachorro até a buzina de um carro, e até mesmo os passos cadenciados em um chão de madeira. Adicionalmente, o MusicGen assume a tarefa de criar peças musicais autênticas de diversos gêneros a partir de uma tela em branco, guiado apenas por descrições textuais. Imagine, por exemplo, um convite para uma “faixa de dança pop, repleta de melodias envolventes, percussões tropicais e ritmos contagiante, uma trilha sonora ideal para uma tarde ensolarada na praia”.
Contribuição para a Comunidade
A Meta observa que, embora os modelos de IA generativa centrados em texto e imagens estáticas tenham recebido muita atenção, o desenvolvimento de ferramentas generativas de áudio tem ficado para trás. No entanto, o lançamento do AudioCraft sob a Licença MIT visa contribuir com a comunidade, oferecendo ferramentas acessíveis para experimentação musical e de áudio.
Ética e Desenvolvimento
É particularmente relevante observar que o MusicGen passou por um treinamento que incorporou mais de “20.000 horas de música pertencente à Meta ou estrategicamente licenciada com o propósito explícito”, evidenciando, assim, uma abordagem nitidamente orientada para a ética no âmbito das preocupações relacionadas aos direitos autorais.
Exemplos
Prompt de entrada: Assobiando com vento soprando
Prompt de entrada: Sirenes e um zumbido de motor se aproximam e passam
Prompt de entrada: Música dançante pop com melodias cativantes, percussões tropicais e ritmos animados, perfeito para a praia
Para o Futuro
É realmente intrigante considerar de que maneira os desenvolvedores irão incorporar esses modelos de áudio fornecidos pela Meta em suas iniciativas. Essa integração promete desencadear o surgimento de ferramentas de áudio generativas, as quais, adicionalmente, têm o potencial de serem tanto envolventes quanto acessíveis. Para aqueles que possuem proficiência em programação, o código-fonte das três funcionalidades do AudioCraft encontram-se prontamente acessíveis no repositório do GitHub.
Fontes de Referência: