Nvidia Apresenta Modelo de IA Que Pode Modificar Vozes e Gerar Novos Sons

Forbes, a mais conceituada revista de negócios e economia do mundo.

A Nvidia apresentou nesta segunda-feira um novo modelo de inteligência artificial para a geração de música e áudio que pode modificar vozes e gerar novos sons – uma tecnologia voltada para produtores de música, filmes e videogames.

A Nvidia, a maior fornecedora mundial de chips e software usados para criar sistemas de IA, disse que não tem planos imediatos para lançar a tecnologia ao público, que chama de Fugatto, abreviação de Foundational Generative Audio Transformer Opus 1.



Leia também




				

			Carreira		
8 Cursos Gratuitos Para Desenvolver Habilidades em IA



				

			Forbes Money		
Amazon Dobra Aposta em Startup de IA e Investe US$ 4 bi



				

			Escolhas do editor		
Transcrição de Áudio: Veja Como Ativar a Novidade do WhatsApp

Ela se junta a outras tecnologias apresentadas por startups, como a Runway, e por empresas de maior porte, como a Meta, que podem gerar áudio ou vídeo a partir de um comando de texto.

A versão da Nvidia gera efeitos sonoros e música a partir de uma descrição de texto, incluindo sons novos, como fazer um trompete latir como um cachorro.

Nvidia

Nova tecnologia é voltada para produtores de música, filmes e videogames. Ilustração de logo da Nvidia – Reuters/Dado Ruvic

O que a diferencia de outras tecnologias de IA é sua capacidade de captar e modificar o áudio existente, por exemplo, pegando uma linha tocada em um piano e transformando-a em uma linha cantada por uma voz humana, ou pegando uma gravação de palavra falada e alterando o sotaque usado e o humor expresso.

“Se pensarmos no áudio sintético dos últimos 50 anos, a música soa diferente agora por causa dos computadores, por causa dos sintetizadores”, disse Bryan Catanzaro, vice-presidente de pesquisa de aprendizagem profunda aplicada da Nvidia. “Acredito que a IA generativa trará novos recursos para a música, para os videogames e para as pessoas comuns que querem criar coisas.”

Embora empresas como a OpenAI estejam negociando com os estúdios de Hollywood sobre se e como a IA poderia ser usada no setor de entretenimento, a relação entre o mundo da tecnologia e Hollywood está tensa, principalmente depois que a estrela Scarlett Johansson acusou a OpenAI de imitar sua voz.

O novo modelo da Nvidia foi treinado com dados de código aberto, e a empresa disse que ainda está discutindo se e como divulgá-lo publicamente.

“Qualquer tecnologia generativa sempre traz alguns riscos, porque as pessoas podem usá-la para gerar coisas que preferiríamos que não fizessem”, disse Catanzaro. “Precisamos ter cuidado com isso, e é por isso que não temos planos imediatos de divulgá-la.”

Os criadores de modelos de IA generativa ainda precisam determinar como evitar o abuso da tecnologia, como um usuário que gera informações incorretas ou infringe direitos autorais ao gerar personagens protegidos por esses direitos.

Escolhas do editor

Escolhas do editor

As 25 Cidades e Estados Mais Seguros dos Estados Unidos

Carreira

8 Cursos Gratuitos Para Desenvolver Habilidades em IA

Foto ilustrativa do novo recurso de transcrição de áudio do WhatsApp

Escolhas do editor

Transcrição de Áudio: Veja Como Ativar a Novidade do WhatsApp

O post Nvidia Apresenta Modelo de IA Que Pode Modificar Vozes e Gerar Novos Sons apareceu primeiro em Forbes Brasil.

Nvidia Apresenta Modelo de IA Que Pode Modificar Vozes e Gerar Novos Sons

Leia também

8 Cursos Gratuitos Para Desenvolver Habilidades em IA

Amazon Dobra Aposta em Startup de IA e Investe US$ 4 bi

Transcrição de Áudio: Veja Como Ativar a Novidade do WhatsApp

Escolhas do editor

As 25 Cidades e Estados Mais Seguros dos Estados Unidos

8 Cursos Gratuitos Para Desenvolver Habilidades em IA

Transcrição de Áudio: Veja Como Ativar a Novidade do WhatsApp

Newsletter

Obrigado

Posts recentes