Tecnologia ao Cubo

Notícias do mundo tech

Meta lança AudioCraft: gerador de música com IA

3 min de leitura

Imagem: Pexels/ThisIsEngineering

Meta lança AudioCraft: gerador de música com IA com código-fonte aberto

A Meta anunciou recentemente a disponibilidade do AudioCraft, uma suíte de ferramentas de AI generativa de código aberto para criação de música e áudio a partir de prompts de texto. Com essa inovadora ferramenta, criadores de conteúdo podem inserir descrições simples para gerar paisagens sonoras complexas, compor melodias e até simular orquestras virtuais completas.

As Três Ferramentas Principais do AudioCraft

O AudioCraft é composto por três componentes essenciais:

  • AudioGen: Uma ferramenta capaz de gerar diversos efeitos sonoros e paisagens sonoras.
  • MusicGen: Pode criar composições musicais e melodias a partir de descrições.
  • EnCodec: Um codec de compressão de áudio baseado em redes neurais.

Avanços Notáveis

Mais especificamente, é notável o refinamento do EnCodec, desenvolvido pela Meta, que culminou em uma aperfeiçoada capacidade de “gerar composições musicais de qualidade superior com uma redução significativa de artefatos”. Em paralelo, o AudioGen demonstra sua versatilidade ao produzir efeitos sonoros que variam desde o latido de um cachorro até a buzina de um carro, e até mesmo os passos cadenciados em um chão de madeira. Adicionalmente, o MusicGen assume a tarefa de criar peças musicais autênticas de diversos gêneros a partir de uma tela em branco, guiado apenas por descrições textuais. Imagine, por exemplo, um convite para uma “faixa de dança pop, repleta de melodias envolventes, percussões tropicais e ritmos contagiante, uma trilha sonora ideal para uma tarde ensolarada na praia”.

Contribuição para a Comunidade

A Meta observa que, embora os modelos de IA generativa centrados em texto e imagens estáticas tenham recebido muita atenção, o desenvolvimento de ferramentas generativas de áudio tem ficado para trás. No entanto, o lançamento do AudioCraft sob a Licença MIT visa contribuir com a comunidade, oferecendo ferramentas acessíveis para experimentação musical e de áudio.

Ética e Desenvolvimento

É particularmente relevante observar que o MusicGen passou por um treinamento que incorporou mais de “20.000 horas de música pertencente à Meta ou estrategicamente licenciada com o propósito explícito”, evidenciando, assim, uma abordagem nitidamente orientada para a ética no âmbito das preocupações relacionadas aos direitos autorais.

Exemplos

Prompt de entrada: Assobiando com vento soprando


Prompt de entrada: Sirenes e um zumbido de motor se aproximam e passam


Prompt de entrada: Música dançante pop com melodias cativantes, percussões tropicais e ritmos animados, perfeito para a praia

Para o Futuro

É realmente intrigante considerar de que maneira os desenvolvedores irão incorporar esses modelos de áudio fornecidos pela Meta em suas iniciativas. Essa integração promete desencadear o surgimento de ferramentas de áudio generativas, as quais, adicionalmente, têm o potencial de serem tanto envolventes quanto acessíveis. Para aqueles que possuem proficiência em programação, o código-fonte das três funcionalidades do AudioCraft encontram-se prontamente acessíveis no repositório do GitHub.

Fontes de Referência:

  1. Arstechnica
  2. Mashable
  3. Meta AI Blog
guest
0 Comentários
Inline Feedbacks
View all comments