A tecnologia de voz percorreu um longo caminho, mas com a implementação de técnicas de inteligência artificial, deu um salto significativo.
Atualmente, ela compreende três processos principais: reconhecimento de voz, síntese de voz e clonagem de voz. O primeiro processa a fala das pessoas e identifica automaticamente o que elas querem dizer com alto grau de compreensão, uma técnica implementada em assistentes pessoais como Siri e Alexa, dispositivos domésticos relacionados a esses assistentes, serviços de tradução, e muito mais.
O segundo, não menos importante, é a síntese de voz, com a capacidade de converter texto em vozes humanas, usado em aplicativos de transcrição, serviços de tradução e na geração de vozes artificiais.
Por fim, há a clonagem de vozes, um campo da tecnologia de voz menos usado do que os anteriores, mas com grande potencial no setor de entretenimento, pois permite criar cópias idênticas da voz de uma pessoa viva ou falecida. Isso serve como base para criar novas versões de músicas, gerar vozes para jogos de vídeo, entre outras coisas.
No entanto, também é motivo de controvérsia, pois pode ser usado para operações fraudulentas, como chamadas telefônicas ou mensagens de voz com vozes falsas.
Como clonar a sua voz ou a voz de outra pessoa com inteligência artificial?
A boa notícia é que as ferramentas de clonagem de voz com inteligência artificial podem ser executadas diretamente do seu navegador de Internet. Uma delas, talvez a que oferece a melhor experiência ao usuário, é a plataforma PlayHT: https://play.ht/, que inclui uma ferramenta de clonagem de voz entre seus geradores de texto para voz com IA.
Para gerar um clone da sua própria voz ou da voz de outra pessoa, basta fazer o upload de uma amostra da voz gravada em um arquivo de áudio para os servidores deles, preferencialmente capturada com microfones de alta qualidade. Para fazer isso, acesse a seção Voice Cloning (Clonagem de Voz) e clique no botão Clone a voice now (Clonar uma voz agora).
Como é comum em plataformas da web, você deve se registrar como novo usuário antes de usar os serviços deles. Após isso, eles disponibilizam 2500 palavras para você experimentar como elas soam com a sua voz clonada. Se você desejar mais palavras, precisará assinar um plano de assinatura.
Imagem criada com Luzia a partir do Telegram