O podcast foi criado pela Play.ht, empresa especializada na criação de ferramentas de geração de texto para voz com IA

Uma empresa de inteligência artificial usou técnicas de deepfake para permitir que “Steve Jobs” (ou uma versão digital dele) concedesse uma entrevista a um podcast. O objetivo da iniciativa foi revelar como é possível criar sons tão realísticos quanto as fotos e vídeos criados com as ferramentas modernas.

Leia também:

O podcast foi criado pela Play.ht, empresa especializada na criação de ferramentas de geração de texto para voz com IA. O material fictício traz o falecido fundador da Apple, Steve Jobs, sendo entrevistado pelo polêmico influenciador Joe Rogan — que teve110 episódios do podcast The Joe Rogan Experience excluídos recentemente, acusado de disseminar informações negacionistas sobre a pandemia de covid-19.

A voz de Jobs ainda parece meio estranha em alguns momentos, mas a IA consegue recriar as nuances da fala, o timbre e até o jeito de falar do ex-CEO da Maçã. A fala de Joe Rogan é mais realista, mas há muito mais materiais disponíveis atualmente do que de uma pessoa falecida há 11 anos.

Roteiro também foi criado por IA
Segundo a Play.ht, o roteiro foi totalmente criado pela inteligência, algo impressionante para um conteúdo sem intervenção humana. Aparentemente, a tecnologia é similar à usada em aplicativos de geração de vídeo e imagem a partir de roteiros, como o DALL-E.

Para chegar ao resultado, a empresa treinou seu algoritmo com dados da biografia de Steve Jobs. Foram usadas diversas gravações obtidas online, a partir de vídeos e palestras em áudio, para que o sistema fosse capaz de trazê-lo de volta à vida com certa precisão.

A empresa garante que o plano agora é ultrapassar o patamar atual de síntese de fala, aprimorando não somente a qualidade da voz, como a eloquência e a habilidade de criar discursos mais “inspiradores e impactantes no mundo da tecnologia”.

Os deepfakes são técnicas de recriação de fotos, vídeos ou vozes de pessoas para simular a realidade. Esse recurso é visto com muita preocupação pelo mercado de tecnologia, já que poderia ser usado para disseminar notícias falsas, incriminar figuras públicas e atentar contra desafetos.

FONTE: Canaltech | FOTO: Reprodução