Hot News
O Google adicionou discretamente um novo bot à documentação do rastreador que rastreia em nome de clientes comerciais do produto Vertex AI. Parece que o novo rastreador pode rastrear apenas sites controlados pelos proprietários do site, mas a documentação não é totalmente clara sobre esse ponto.
Agentes de IA Vertex
O Google-CloudVertexBot, o novo rastreador, ingere conteúdo do site para clientes da Vertex AI, diferentemente de outros bots listados na documentação do Search Central que estão vinculados à Pesquisa Google ou à publicidade.
A documentação oficial do Google Cloud oferece as seguintes informações:
“No Vertex AI Agent Builder, há vários tipos de armazenamentos de dados. Um armazenamento de dados pode conter apenas um tipo de dado.”
Ele continua listando seis tipos de dados, um dos quais são dados de sites públicos. Sobre o crawling, a documentação diz que há dois tipos de crawling de sites com limitações específicas para cada tipo.
- Indexação básica de sites
- Indexação avançada de sites
A documentação é confusa
A documentação explica os dados do site:
“Um armazenamento de dados com dados de sites usa dados indexados de sites públicos. Você pode fornecer um conjunto de domínios e configurar pesquisa ou recomendações sobre dados rastreados dos domínios. Esses dados incluem texto e imagens marcados com metadados.”
A descrição acima não diz nada sobre a verificação de domínios. A descrição de Indexação básica de sites também não diz nada sobre a verificação do proprietário do site.
Mas a documentação para indexação avançada de sites diz que a verificação de domínio é necessária e também impõe cotas de indexação.
No entanto, a documentação do próprio rastreador diz que o novo rastreador rastreia a “solicitação dos proprietários do site”, então pode ser que ele não rastreie sites públicos.
Agora vem a parte confusa: a notação do Changelog para esse novo rastreador indica que ele pode vir para rastrear seu site.
Aqui está o que o changelog diz:
“O novo rastreador foi introduzido para ajudar os proprietários de sites a identificar o novo tráfego do rastreador.”
Novo rastreador do Google
O novo rastreador é chamado Google-CloudVertexBot.
Estas são as novas informações sobre ele:
“O Google-CloudVertexBot rastreia sites mediante solicitação dos proprietários ao criar agentes Vertex AI.
Tokens de agente de usuário
- Google CloudVertexBot
- Googlebot”
Substring do agente do usuário
Google CloudVertexBot
Documentação pouco clara
A documentação parece indicar que o novo rastreador não indexa sites públicos, mas o changelog indica que ele foi adicionado para que os proprietários de sites possam identificar o tráfego do novo rastreador. Você deve bloquear o novo rastreador com um robots.txt apenas no caso de? Não é absurdo considerar isso, já que a documentação não é muito clara sobre se ela rastreia apenas domínios que são verificados como estando sob o controle da entidade que inicia o rastreamento.
Leia a nova documentação do Google:
Google CloudVertexBot
Imagem em destaque por Shutterstock/ShotPrime Studio
#hotnews #noticias #tecnologia #AtualizaçõesDiárias #SigaHotnews #FiquePorDentro #ÚltimasNotícias #InformaçãoAtual