Newsletter

Google lança IA Gemini capaz de criar músicas a partir de texto, fotos ou vídeos

O Google tem trabalhado para mostrar aos investidores que seus investimentos em produtos movidos por IA podem ajudar a aumentar a receita

Por
Publicidade

A Alphabet, do Google, e a Apple estão adicionando recursos de inteligência artificial generativa focados em música em seus principais aplicativos de consumo, destacando como ferramentas avançadas de IA estão entrando no uso mainstream.

O assistente de IA Gemini do Google agora pode criar faixas musicais de 30 segundos a partir de texto, fotos ou vídeos enviados pelos usuários, usando o modelo Lyria 3 da Google DeepMind, informou a empresa em um post no blog na quarta-feira (18).

O recurso, que pode gerar letras personalizadas ou áudio puramente instrumental, estará disponível para usuários com mais de 18 anos em múltiplos idiomas. Ele está sendo lançado na versão desktop do Gemini e aparecerá no aplicativo móvel nos próximos dias, disse a empresa.

O modelo popular de criação de imagens, Nano Banana, também gerará capas personalizadas junto com a faixa, adicionando um elemento visual quando os usuários compartilharem links das músicas com outras pessoas, informou o Google.

Adicionar ferramentas de criação de áudio ao seu aplicativo móvel pode potencialmente fortalecer as ofertas de consumo do Google, que continua em uma corrida com o ChatGPT da OpenAI para conquistar usuários. O Google recebeu ampla aprovação de investidores e usuários por seu modelo de IA Gemini 3, lançado em novembro, levando o CEO da OpenAI, Sam Altman, a declarar um “código vermelho” para acelerar melhorias no ChatGPT.

E a Apple?

Separadamente, nesta semana, a Apple anunciou que os consumidores em breve poderão usar IA para criar playlists no Apple Music. O recurso, chamado Playlist Playground, usa a Apple Intelligence para permitir que as pessoas transformem prompts de texto em playlists que incluem capa, descrição e 25 músicas. Ele está incluído no iOS 26.4, lançado em versão beta na segunda-feira, e estará mais amplamente disponível nesta primavera. O novo recurso do Apple Music concorre com funcionalidade similar oferecida pelo Spotify Technology.

As ações do Spotify chegaram a perder ganhos após o anúncio do Google. As ações da Sirius XM Holdings também caíram. “Não esperamos que isso seja um fator decisivo para o Spotify”, escreveram analistas da Bloomberg Intelligence em nota na quarta-feira. “Ainda assim, acreditamos que essas ações podem forçar o Spotify a lançar em breve um recurso de mixagem por IA.”

A Apple, que tem ficado atrás em inteligência artificial, trabalha para adicionar mais recursos de IA em seus aplicativos e dispositivos, incluindo em seu pacote de software recém-lançado Creator Studio. Mas algumas atualizações muito aguardadas do assistente virtual Siri podem ser adiadas após terem sido anunciadas inicialmente em 2024, informou a Bloomberg News na semana passada.

O Google, por sua vez, tem trabalhado para mostrar aos investidores que seus investimentos em produtos movidos por IA podem ajudar a aumentar a receita. Para lançamentos como este, isso significa que o produto não é completamente gratuito. Assim como o Gemini impõe limites na criação diária de imagens, usuários da versão gratuita podem gerar 10 faixas por dia, enquanto usuários pagos podem gerar de 20 a 100 diárias, dependendo do nível da assinatura. Os usuários terão direito a usar suas faixas geradas, disse a empresa, acrescentando que há filtros para verificar se os resultados não violam regras de propriedade intelectual ou privacidade.

Ferramentas de IA generativa têm sido recebidas com cautela e, às vezes, hostilidade pela indústria musical, que vê parte da tecnologia como uma ameaça aos seus negócios e à sua propriedade intelectual. Em 2024, Universal Music, Warner Music e Sony Music processaram as startups Suno AI e Uncharted Labs, desenvolvedora do Udio AI, por violação de direitos autorais. A Warner Music desde então chegou a um acordo com a Suno, e tanto ela quanto a Universal Music fecharam acordos com o Udio para manter o app funcionando com licenciamento e controles adequados.

Publicidade

O Google afirmou no blog que possui salvaguardas que impedem a IA de copiar conteúdo de artistas específicos. Se os usuários mencionarem músicos reais, o Gemini usará o prompt apenas como “inspiração criativa ampla e criará uma faixa que compartilhe estilo ou humor semelhante”, acrescentou.

“Nosso treinamento para o Lyria 3 é projetado para usar músicas que o YouTube e o Google têm direito de utilizar sob noss

Exit mobile version