Abril 5, 2025
Google lança discretamente novo rastreador de IA
 #ÚltimasNotícias #tecnologia

Google lança discretamente novo rastreador de IA #ÚltimasNotícias #tecnologia

Continue apos a publicidade

Hot News

O Google adicionou discretamente um novo bot à documentação do rastreador que rastreia em nome de clientes comerciais do produto Vertex AI. Parece que o novo rastreador pode rastrear apenas sites controlados pelos proprietários do site, mas a documentação não é totalmente clara sobre esse ponto.

Agentes de IA Vertex

O Google-CloudVertexBot, o novo rastreador, ingere conteúdo do site para clientes da Vertex AI, diferentemente de outros bots listados na documentação do Search Central que estão vinculados à Pesquisa Google ou à publicidade.

A documentação oficial do Google Cloud oferece as seguintes informações:

“No Vertex AI Agent Builder, há vários tipos de armazenamentos de dados. Um armazenamento de dados pode conter apenas um tipo de dado.”

Continue após a publicidade

Ele continua listando seis tipos de dados, um dos quais são dados de sites públicos. Sobre o crawling, a documentação diz que há dois tipos de crawling de sites com limitações específicas para cada tipo.

  1. Indexação básica de sites
  2. Indexação avançada de sites

A documentação é confusa

A documentação explica os dados do site:

“Um armazenamento de dados com dados de sites usa dados indexados de sites públicos. Você pode fornecer um conjunto de domínios e configurar pesquisa ou recomendações sobre dados rastreados dos domínios. Esses dados incluem texto e imagens marcados com metadados.”

A descrição acima não diz nada sobre a verificação de domínios. A descrição de Indexação básica de sites também não diz nada sobre a verificação do proprietário do site.

Continue após a publicidade

Mas a documentação para indexação avançada de sites diz que a verificação de domínio é necessária e também impõe cotas de indexação.

No entanto, a documentação do próprio rastreador diz que o novo rastreador rastreia a “solicitação dos proprietários do site”, então pode ser que ele não rastreie sites públicos.

Agora vem a parte confusa: a notação do Changelog para esse novo rastreador indica que ele pode vir para rastrear seu site.

Aqui está o que o changelog diz:

Continue após a publicidade

“O novo rastreador foi introduzido para ajudar os proprietários de sites a identificar o novo tráfego do rastreador.”

Novo rastreador do Google

O novo rastreador é chamado Google-CloudVertexBot.

Estas são as novas informações sobre ele:

“O Google-CloudVertexBot rastreia sites mediante solicitação dos proprietários ao criar agentes Vertex AI.

Continue após a publicidade

Tokens de agente de usuário

  • Google CloudVertexBot
  • Googlebot”

Substring do agente do usuário
Google CloudVertexBot

Documentação pouco clara

A documentação parece indicar que o novo rastreador não indexa sites públicos, mas o changelog indica que ele foi adicionado para que os proprietários de sites possam identificar o tráfego do novo rastreador. Você deve bloquear o novo rastreador com um robots.txt apenas no caso de? Não é absurdo considerar isso, já que a documentação não é muito clara sobre se ela rastreia apenas domínios que são verificados como estando sob o controle da entidade que inicia o rastreamento.

Leia a nova documentação do Google:

Continue após a publicidade

Google CloudVertexBot

Imagem em destaque por Shutterstock/ShotPrime Studio

Siga-nos nas redes sociais:

Hotnews.pt |
Facebook |
Instagram |
Telegram

Continue após a publicidade

#hotnews #noticias #tecnologia #AtualizaçõesDiárias #SigaHotnews #FiquePorDentro #ÚltimasNotícias #InformaçãoAtual

Continue após a publicidade

Deixe um comentário

O seu endereço de email não será publicado. Campos obrigatórios marcados com *