DeepMind: o avanço da geração de fala do Google

Compartilhe esta história!
No dia em que as pessoas puderem ser totalmente enganadas ao conversar com uma entidade robótica, a sociedade estará madura para qualquer ilusão que os Tecnocratas considerem necessária para implementar a Tecnocracia. Robots, Chatbots e SexBots serão recebidos como humanos. Editor TN

A unidade DeepMind do Google, que está trabalhando para desenvolver computadores super-inteligentes, criou um sistema para fala gerada por máquina que, segundo ele, supera a tecnologia existente em 50 por cento.

O DeepMind, com sede no Reino Unido, que o Google adquiriu por cerca de 400 milhão de libras (US $ 533 milhões) no 2014, desenvolveu uma inteligência artificial chamada WaveNet que pode imitar a fala humana, aprendendo a formar as ondas sonoras individuais que uma voz humana cria, disse em um postagem do blog sexta-feira. Em testes às cegas para inglês dos EUA e chinês mandarim, ouvintes humanos descobriram que a fala gerada pelo WaveNet parecia mais natural do que a criada com qualquer um dos programas de conversão de texto em fala do Google, baseados em diferentes tecnologias. O WaveNet ainda teve um desempenho inferior ao das gravações da fala humana real.

Muitos programas de fala gerados por computador funcionam usando um grande conjunto de dados de gravações curtas de um único falante humano e combinando esses fragmentos de fala para formar novas palavras. O resultado é inteligível e soa humano, se não completamente natural. A desvantagem é que o som da voz não pode ser facilmente modificado. Outros sistemas formam a voz completamente eletronicamente, geralmente com base em regras sobre como são pronunciadas certas combinações de letras. Esses sistemas permitem que o som da voz seja manipulado facilmente, mas tendem a soar menos naturais do que as conversas geradas por computador, com base em gravações de alto-falantes humanos, disse DeepMind.

WaveNet é um tipo de IA chamado rede neural projetada para imitar o funcionamento de partes do cérebro humano. Essas redes precisam ser treinadas com grandes conjuntos de dados.

Leia a história completa aqui…

Subscrever
Receber por
convidado

1 Comentário
mais velho
Os mais novos Mais votados
Comentários em linha
Ver todos os comentários
Ray Songtree

Pat prega a situação com seu comentário, mais uma vez.