SÃO PAULO, SP (FOLHAPRESS) – Durante a apresentação do novo cérebro por trás do ChatGPT e da versão atualizada de seu assistente de voz, na última segunda (13), a OpenAI despertou comparações com a interação de Joaquin Phoenix com a robô Samantha, interpretada apenas em voz por Scarlett Johansson, no filme “Ela” (“Her”, no original).
Os internautas mais atentos disseram que mais do que o desempenho quase humano da ferramenta, a similaridade estava no timbre usado pela inteligência artificial.
Os comentários ganharam tom de crítica, e a empresa respondeu removendo a personagem Sky, que dava voz ao ChatGPT. “Nós acreditamos que vozes de inteligência artificial não devam imitar deliberadamente a voz única de celebridades”, diz publicação no blog da empresa, nesta segunda (20).
A sonoridade de Sky, de acordo com a nota, pertence originalmente a outra atriz, não a Scarlett Johansson. A OpenAI diz que não divulgará a identidade da dubladora para não comprometer a privacidade dela.
“Ouvimos os pontos sobre como escolhemos as vozes disponíveis no ChatGPT, especialmente Sky, e vamos pausar seu uso enquanto abordamos os problemas”, afirmou o comunicado.
O ChatGPT tem um modo de voz desde setembro, com cinco opções de dublagem cada uma tem um personagem: Breeze, Cove, Ember, Juniper e Sky. “Recebemos mais de 400 candidaturas de dubladores antes de escolher as cinco vozes atuais.”
Segundo a empresa, o processo seletivo teve participação de diretores de elenco premiados, tal qual uma produção de cinema. “Trabalhamos com eles para eleger uma série de critérios para escolha de vozes do ChatGPT, considerando a personalidade única que deveria ter cada voz, considerando o apelo para os diferentes nichos do público global.”
A empresa buscou dubladores de origens diversas ou que pudessem falar diversos idiomas, que tivessem uma voz “que soe atemporal, inspire confiança e seja carismática e natural ao ouvido”.
As seleções começaram em maio e duraram um mês. As gravações foram feitas em San Francisco, nos Estados Unidos, durante junho e julho. O material gravado serviu para treinar modelos de IA geradores de voz.
O novo modo de voz que permite conversa em tempo real apresentado junto ao GPT-4o deve chegar aos assinantes do plano ChatGPT Plus, vendido por US$ 10 (R$ 52), “nas próximas semanas”, de acordo com a OpenAI. Não há informações de quando o recurso estará disponível para o público em geral.
Em fala com funcionários da startup, o ChatGPT mostrou ser capaz de emular variações no tom de voz e até de cantar novidades que não acrescentam à performance da plataforma, mas a tornam mais parecida a um ser humano.
A apresentação da nova versão do ChatGPT foi seguida do pedido de demissão do cientista-chefe responsável pelo desenvolvimento do chatbot, Ilya Sutskever. Ele participou da reunião do conselho que votou pela destituição do presidente-executivo da startup, Sam Altman, em novembro. Altman, porém, contornou o revés e voltou ao comando após duas semanas fora.
Na última sexta (17), a OpenAI anunciou o fim da sua equipe de avaliação de risco.
Em evento do jornal Wall Street Journal em outubro, Altman afirmou “ter muitas desconfianças de modelos de inteligência artificial produzidos para mostrar simpatia com seres humanos”.
O executivo, contudo, embarcou no burburinho que gerou a semelhança entre o novo ChatGPT e a robô Samantha, do filme “Ela”, o que alçou a plataforma de IA ao primeiro lugar dos trending topics do X no dia 13. “Her”, escreveu ele na rede social, sem mais comentários. Bastou para gerar 2.000 respostas e mais de 7.000 retweets.
PEDRO S. TEIXEIRA / Folhapress