Abril 8, 2025
Waymo quer usar o Gemini do Google para treinar seus robotáxis
 #ÚltimasNotícias #tecnologia

Waymo quer usar o Gemini do Google para treinar seus robotáxis #ÚltimasNotícias #tecnologia

Continue apos a publicidade

Hot News

A Waymo há muito elogia seus laços com o DeepMind do Google e suas décadas de pesquisa em IA como uma vantagem estratégica sobre seus rivais no espaço de direção autônoma. Agora, a empresa de propriedade da Alphabet está dando um passo adiante ao desenvolver um novo modelo de treinamento para seus robotáxis construído no modelo multimodal de linguagem grande (MLLM) Gemini do Google.

Waymo lançou hoje um novo artigo de pesquisa que apresenta um “Modelo Multimodal Ponta a Ponta para Condução Autônoma”, também conhecido como EMMA. Este novo modelo de treinamento ponta a ponta processa dados de sensores para gerar “trajetórias futuras para veículos autônomos”, ajudando os veículos sem motorista da Waymo a tomar decisões sobre para onde ir e como evitar obstáculos.

Mas o mais importante é que esta é uma das primeiras indicações de que o líder em condução autónoma tem planos para utilizar MLLMs nas suas operações. E é um sinal de que esses LLMs podem se libertar de seu uso atual como chatbots, organizadores de e-mail e geradores de imagens e encontrar aplicação em um ambiente totalmente novo na estrada. No seu trabalho de investigação, a Waymo propõe “desenvolver um sistema de condução autónomo no qual o MLLM seja um cidadão de primeira classe”.

Modelo multimodal ponta a ponta para direção autônoma, também conhecido como EMMA

Continue após a publicidade

O artigo descreve como, historicamente, os sistemas de condução autónoma desenvolveram “módulos” específicos para as diversas funções, incluindo percepção, mapeamento, previsão e planeamento. Esta abordagem tem se mostrado útil há muitos anos, mas apresenta problemas de dimensionamento “devido aos erros acumulados entre os módulos e à comunicação limitada entre módulos”. Além disso, estes módulos poderão ter dificuldade em responder a “ambientes novos” porque, por natureza, são “pré-definidos”, o que pode dificultar a adaptação.

Waymo diz que MLLMs como Gemini apresentam uma solução interessante para alguns desses desafios por dois motivos: o chat é um “generalista” treinado em vastos conjuntos de dados extraídos da internet “que fornecem um rico ‘conhecimento de mundo’ além do que está contido em comum registros de condução”; e demonstram capacidades de raciocínio “superiores” através de técnicas como o “raciocínio em cadeia de pensamento”, que imita o raciocínio humano ao dividir tarefas complexas numa série de passos lógicos.

Modelo EMMA da Waymo.
Captura de tela: Waymo

A Waymo desenvolveu o EMMA como uma ferramenta para ajudar seus robotáxis a navegar em ambientes complexos. A empresa identificou diversas situações em que o modelo ajudou seus carros sem motorista a encontrar a rota certa, incluindo o encontro com vários animais ou construções na estrada.

Continue após a publicidade

Outras empresas, como a Tesla, têm falado extensivamente sobre o desenvolvimento de modelos completos para os seus carros autónomos. Elon Musk afirma que a versão mais recente de seu sistema Full Self-Driving (12.5.5) usa um sistema de IA de “redes neurais ponta a ponta” que traduz imagens da câmera em decisões de direção.

Esta é uma indicação clara de que a Waymo, que lidera a Tesla na implantação de veículos reais sem motorista nas estradas, também está interessada em buscar um sistema de ponta a ponta. A empresa disse que seu modelo EMMA se destacou na previsão de trajetória, detecção de objetos e compreensão de gráficos rodoviários.

Continue após a publicidade

“Isso sugere um caminho promissor para pesquisas futuras, onde ainda mais tarefas essenciais de direção autônoma poderiam ser combinadas em uma configuração semelhante e ampliada”, disse a empresa em um post no blog hoje.

Mas o EMMA também tem as suas limitações e a Waymo reconhece que será necessária investigação futura antes que o modelo seja colocado em prática. Por exemplo, o EMMA não conseguiu incorporar entradas de sensores 3D de lidar ou radar, que Waymo disse ser “computacionalmente caro”. E só conseguia processar uma pequena quantidade de quadros de imagem por vez.

Continue após a publicidade

Também existem riscos no uso de MLLMs para treinar robotáxis que não são mencionados no artigo de pesquisa. Chatbots como o Gemini muitas vezes têm alucinações ou falham em tarefas simples, como ler relógios ou contar objetos. Waymo tem muito pouca margem de erro quando seus veículos autônomos viajam a 64 km/h em uma estrada movimentada. Mais pesquisas serão necessárias antes que esses modelos possam ser implantados em escala – e Waymo é claro sobre isso.

“Esperamos que nossos resultados inspirem mais pesquisas para mitigar esses problemas”, escreve a equipe de pesquisa da empresa, “e para evoluir ainda mais o estado da arte em arquiteturas de modelos de direção autônoma”.

Siga-nos nas redes sociais:

Continue após a publicidade

Hotnews.pt |
Facebook |
Instagram |
Telegram

#hotnews #noticias #tecnologia #AtualizaçõesDiárias #SigaHotnews #FiquePorDentro #ÚltimasNotícias #InformaçãoAtual

Continue após a publicidade

Deixe um comentário

O seu endereço de email não será publicado. Campos obrigatórios marcados com *