SÃO FRANCISCO — A última atualização da OpenAI em seu padrão de perceptibilidade sintético pode imitar cadências humanas em suas respostas verbais e pode até tentar detectar o humor das pessoas.
O efeito evoca imagens do movimento “Her” de Spike Jonze de 2013, onde o personagem principal (humano) se apaixona por um sistema operacional artificialmente inteligente, levando a algumas complicações.
Embora poucos achem o novo padrão sedutor, a OpenAI diz que ele funciona mais rápido que as versões anteriores e pode raciocinar em texto, áudio e vídeo em tempo real.
GPT-4o, abreviatura de “omni”, alimentará o popular chatbot ChatGPT da OpenAI e estará disponível para usuários, incluindo aqueles que usam a versão gratuita, nas próximas semanas, anunciou a empresa durante uma breve atualização transmitida ao vivo. O CEO Sam Altman, que não foi um dos apresentadores do evento, simplesmente postou a termo “ela” na rede social X.
Durante uma mostra com a diretora de tecnologia Mira Murati e outros executivos, o bot de IA conversou em tempo real, acrescentando emoção – especificamente “mais drama” – à sua voz, conforme solicitado. Também ajudou a percorrer as etapas necessárias para resolver uma equação matemática simples sem primeiro esputar a resposta e auxiliou em um problema de codificação de software mais multíplice na tela do computador.
Também foi necessário extrapolar o estado emocional de uma pessoa olhando um vídeo de selfie de seu rosto (decidindo que ele estava feliz porque estava sorrindo) e traduzindo inglês e italiano para mostrar uma vez que isso poderia ajudar pessoas que falam idiomas diferentes a conversar.
O comentador do Gartner, Chirag Dekate, disse que a atualização, que durou menos de 30 minutos, deu a sensação de que a OpenAI está tentando depreender rivais maiores.
“Muitas das demonstrações e recursos apresentados pela OpenAI pareciam familiares porque vimos versões avançadas dessas demonstrações apresentadas pelo Google em seu lançamento pro Gemini 1.5”, disse Dekate. “Embora a Open AI tenha tido uma vantagem de ser pioneira no ano pretérito com ChatGPT e GPT3, quando comparada com seus pares, mormente o Google, agora estamos vendo o surgimento de lacunas de capacidade.”
O Google planeja realizar sua conferência de desenvolvedores I/O na terça e quarta-feira, onde deverá revelar atualizações para seu próprio Gemini, seu padrão de IA.