O CEO do Google, Sundar Pichai, fala na conferência de desenvolvedores do Google I/O.
Andrej Sokolow | Confederação de imagens | Imagens Getty
Google na terça-feira sediou sua conferência anual de desenvolvedores de I/O e lançou uma variedade de produtos de perceptibilidade sintético, desde novos recursos de pesquisa e bate-papo até hardware de IA para clientes em nuvem. Os anúncios ressaltam o foco da empresa na IA, uma vez que ela afasta concorrentes, uma vez que a OpenAI.
Muitos dos recursos ou ferramentas revelados pelo Google estão exclusivamente em temporada de testes ou limitados aos desenvolvedores, mas dão uma teoria de uma vez que a gigante da tecnologia está pensando sobre IA e onde está investindo. O Google ganha verba com IA cobrando dos desenvolvedores que usam seus modelos e dos clientes que pagam pelo Gemini Advanced, seu concorrente do ChatGPT, que custa US$ 19,99 por mês e pode ajudar os usuários a reunir PDFs, Google Docs e muito mais.
Os anúncios de terça-feira seguem eventos semelhantes realizados por seus concorrentes de IA. No início deste mês, AmazonasA Anthropic, apoiada pela Anthropic, anunciou sua primeira oferta empresarial e um aplicativo gratuito para iPhone. Enquanto isso, a OpenAI lançou na segunda-feira um novo protótipo de IA e uma versão desktop do ChatGPT, junto com uma novidade interface de usuário.
Cá está o que o Google anunciou.
Atualizações da IA do Gemini
O Google introduziu atualizações no Gemini 1.5 Pro, seu protótipo de IA que em breve será capaz de mourejar com ainda mais dados — por exemplo, a instrumento pode reunir 1.500 páginas de texto enviadas por um usuário.
Há também um novo protótipo Gemini 1.5 Flash AI, que a empresa afirma ser mais econômico e projetado para tarefas menores, uma vez que reunir rapidamente conversas, legendar imagens e vídeos e extrair dados de documentos grandes.
O CEO do Google, Sundar Pichai, destacou melhorias nas traduções do Gemini, acrescentando que ele estará disponível para todos os desenvolvedores em todo o mundo em 35 idiomas. Dentro do Gmail, o Gemini 1.5 Pro analisará PDFs e vídeos anexados, fornecendo resumos e muito mais, disse Pichai. Isso significa que se você perdeu um longo e-mail durante as férias, o Gemini poderá resumi-lo junto com quaisquer anexos.
As novas atualizações do Gemini também são úteis para pesquisar no Gmail. Um exemplo que a empresa deu: se você estiver comparando preços de diferentes empreiteiros para consertar seu telhado e estiver procurando um resumo para ajudá-lo a deliberar quem escolher, a Gemini poderá retornar três cotações junto com as datas de início previstas oferecidas em diferentes e-mails tópicos.
O Google disse que o Gemini eventualmente substituirá o Google Assistant em telefones Android, sugerindo que será um concorrente mais poderoso para da maçã Siri no iPhone.
Google Veo, Imagen 3 e visões gerais de áudio
O Google anunciou o “Veo”, seu mais recente protótipo para geração de vídeo de subida definição, e o Imagen 3, seu protótipo de texto para imagem da mais subida qualidade, que promete imagens realistas e “menos artefatos visuais perturbadores do que nossos modelos anteriores”.
As ferramentas estarão disponíveis para criadores selecionados na segunda-feira e chegarão ao Vertex AI, a plataforma de tirocínio de máquina do Google que permite aos desenvolvedores treinar e implantar aplicativos de IA.
A empresa também apresentou “Visões Gerais de Áudio”, a capacidade de gerar discussões em áudio com base na ingresso de texto. Por exemplo, se um usuário carrega um projecto de lição, o chatbot pode falar um resumo dele. Ou, se você pedir um exemplo de problema científico na vida real, poderá fazê-lo por meio de áudio interativo.

Separadamente, a empresa também apresentou o “AI Sandbox”, uma gama de ferramentas generativas de IA para gerar músicas e sons do zero, com base nas instruções do usuário.
No entanto, ferramentas generativas de IA, uma vez que chatbots e criadores de imagens, continuam a ter problemas de precisão.
O director de pesquisa do Google, Prabhakar Raghavan, disse aos funcionários no mês pretérito que os concorrentes “podem ter um novo aparelho com o qual as pessoas gostam de distrair, mas eles ainda vêm ao Google para verificar o que veem lá porque é a natividade confiável e se torna mais crítico”. nesta era de IA generativa.”
No início deste ano, o Google lançou o gerador de imagens com tecnologia Gemini. Os usuários descobriram imprecisões históricas que se tornaram virais online, e a empresa retirou o recurso, dizendo que o relançaria nas próximas semanas. O recurso ainda não foi relançado.
Novos recursos de pesquisa
A gigante da tecnologia está lançando “Visões gerais de IA” na Pesquisa Google na segunda-feira nos EUA. As visões gerais de IA mostram um rápido resumo das respostas às perguntas de pesquisa mais complexas, de consonância com Liz Reid, director da Pesquisa Google. Por exemplo, se um usuário pesquisar a melhor maneira de limpar botas de pele, a página de resultados poderá exibir uma “Visão universal da IA” na segmento superior com um processo de limpeza em várias etapas, obtido a partir de informações sintetizadas na web.
A empresa disse que planeja introduzir recursos de planejamento semelhantes a assistentes diretamente na pesquisa. Ele explicou que os usuários poderão pesquisar alguma coisa uma vez que “‘Crie um projecto de refeições de 3 dias para um grupo que seja fácil de preparar'” e você terá um ponto de partida com uma ampla variedade de receitas de todo o web .
No que diz reverência ao seu progresso para oferecer “multimodalidade” ou integração de mais imagens e vídeos em ferramentas generativas de IA, o Google disse que começará a testar a capacidade dos usuários de fazer perguntas por meio de vídeo, uma vez que filmar um problema com um resultado de sua propriedade, fazer upload e pedindo ao mecanismo de pesquisa para desvendar o problema. Em um exemplo, o Google mostrou alguém filmando um toca-discos quebrado enquanto perguntava por que ele não estava funcionando. A Pesquisa Google encontrou o protótipo do toca-discos e sugeriu que ele poderia estar com defeito porque não estava devidamente balanceado.
Outro novo recurso em teste é chamado “AI Teammate”, que será integrado ao Google Workspace do usuário. Ele pode gerar uma coleção pesquisável de trabalhos a partir de mensagens e conversas de e-mail com mais PDFs e documentos. Por exemplo, um horizonte fundador poderia perguntar ao companheiro de equipe de IA: “Estamos prontos para o lançamento?” e o assistente fornecerá uma estudo e um resumo com base nas informações que pode acessar no Gmail, Google Docs e outros aplicativos do Workspace.
Projeto Astra
O Projeto Astra é o mais recente progressão do Google em seu assistente de IA que está sendo desenvolvido pela unidade DeepMind AI do Google. Por enquanto, é exclusivamente um protótipo, mas você pode pensar nisso uma vez que o objetivo do Google de desenvolver sua própria versão do JARVIS, o onisciente assistente de IA de Tony Stark do Universo Marvel.
No vídeo de mostra apresentado no Google I/O, o assistente — por meio de vídeo e áudio, em vez de uma interface de chatbot — conseguiu ajudar o usuário a lembrar onde deixou os óculos, revisar o código e responder perguntas sobre o que é uma determinada segmento de um óculos. alto-falante é chamado, quando esse alto-falante foi mostrado em vídeo.
O Google disse que um chatbot verdadeiramente útil precisa permitir que os usuários “conversem com ele naturalmente e sem atrasos”. A conversa no vídeo de mostra aconteceu em tempo real, sem atrasos. A mostra seguiu o showcase da OpenAI na segunda-feira de uma conversa de áudio semelhante com o ChatGPT.
O CEO da DeepMind, Demis Hassabis, disse no palco que “reduzir o tempo de resposta para alguma coisa conversacional é um difícil repto de engenharia”.
Pichai disse que espera que o Projeto Astra seja lançado no Gemini ainda levante ano.
Hardware de IA
O Google também anunciou o Trillium, seu TPU de sexta geração, ou unidade de processamento tensor – uma peça de hardware forçoso para a realização de operações complexas de IA – que estará disponível para clientes em nuvem no final de 2024.
As TPUs não foram feitas para competir com outros chips, uma vez que da Nvidia unidades de processamento gráfico. Pichai observou durante o I/O, por exemplo, que o Google Cloud começará a oferecer GPUs Blackwell da Nvidia no início de 2025.
A Nvidia disse em março que o Google usará a plataforma Blackwell para “várias implantações internas e será um dos primeiros provedores de nuvem a oferecer instâncias com tecnologia Blackwell”, e que o chegada aos sistemas da Nvidia ajudará o Google a oferecer ferramentas em grande graduação para empresas desenvolvedores construindo grandes modelos de linguagem.
Em seu oração, Pichai destacou a “parceria de longa data do Google com a Nvidia”. As empresas trabalham juntas há mais de uma dezena e Pichai disse no pretérito que espera que ainda o façam daqui a uma dezena.
