Nvidia Apresenta Modelo de IA Que Pode Modificar Vozes e Gerar Novos Sons

Forbes, a mais conceituada revista de negócios e economia do mundo.

A Nvidia apresentou nesta segunda-feira um novo modelo de inteligência artificial para a geração de música e áudio que pode modificar vozes e gerar novos sons – uma tecnologia voltada para produtores de música, filmes e videogames.

A Nvidia, a maior fornecedora mundial de chips e software usados para criar sistemas de IA, disse que não tem planos imediatos para lançar a tecnologia ao público, que chama de Fugatto, abreviação de Foundational Generative Audio Transformer Opus 1.

Leia também

Getty Images
Carreira

8 Cursos Gratuitos Para Desenvolver Habilidades em IA

Reuters
Forbes Money

Amazon Dobra Aposta em Startup de IA e Investe US$ 4 bi

Foto ilustrativa do novo recurso de transcrição de áudio do WhatsApp
Escolhas do editor

Transcrição de Áudio: Veja Como Ativar a Novidade do WhatsApp

Ela se junta a outras tecnologias apresentadas por startups, como a Runway, e por empresas de maior porte, como a Meta, que podem gerar áudio ou vídeo a partir de um comando de texto.

A versão da Nvidia gera efeitos sonoros e música a partir de uma descrição de texto, incluindo sons novos, como fazer um trompete latir como um cachorro.

Nvidia

Nova tecnologia é voltada para produtores de música, filmes e videogames. Ilustração de logo da Nvidia – Reuters/Dado Ruvic

O que a diferencia de outras tecnologias de IA é sua capacidade de captar e modificar o áudio existente, por exemplo, pegando uma linha tocada em um piano e transformando-a em uma linha cantada por uma voz humana, ou pegando uma gravação de palavra falada e alterando o sotaque usado e o humor expresso.

“Se pensarmos no áudio sintético dos últimos 50 anos, a música soa diferente agora por causa dos computadores, por causa dos sintetizadores”, disse Bryan Catanzaro, vice-presidente de pesquisa de aprendizagem profunda aplicada da Nvidia. “Acredito que a IA generativa trará novos recursos para a música, para os videogames e para as pessoas comuns que querem criar coisas.”

Embora empresas como a OpenAI estejam negociando com os estúdios de Hollywood sobre se e como a IA poderia ser usada no setor de entretenimento, a relação entre o mundo da tecnologia e Hollywood está tensa, principalmente depois que a estrela Scarlett Johansson acusou a OpenAI de imitar sua voz.

O novo modelo da Nvidia foi treinado com dados de código aberto, e a empresa disse que ainda está discutindo se e como divulgá-lo publicamente.

“Qualquer tecnologia generativa sempre traz alguns riscos, porque as pessoas podem usá-la para gerar coisas que preferiríamos que não fizessem”, disse Catanzaro. “Precisamos ter cuidado com isso, e é por isso que não temos planos imediatos de divulgá-la.”

Os criadores de modelos de IA generativa ainda precisam determinar como evitar o abuso da tecnologia, como um usuário que gera informações incorretas ou infringe direitos autorais ao gerar personagens protegidos por esses direitos.

Escolhas do editor

Getty Images
Escolhas do editor

As 25 Cidades e Estados Mais Seguros dos Estados Unidos

Getty Images
Carreira

8 Cursos Gratuitos Para Desenvolver Habilidades em IA

Foto ilustrativa do novo recurso de transcrição de áudio do WhatsApp
Escolhas do editor

Transcrição de Áudio: Veja Como Ativar a Novidade do WhatsApp

O post Nvidia Apresenta Modelo de IA Que Pode Modificar Vozes e Gerar Novos Sons apareceu primeiro em Forbes Brasil.

Adicionar aos favoritos o Link permanente.