Novembro 14, 2024
Washington Post, Virginia Tech colaboram em ferramenta de busca de notícias de IA | Virginia Tech News
 #ÚltimasNotícias

Washington Post, Virginia Tech colaboram em ferramenta de busca de notícias de IA | Virginia Tech News #ÚltimasNotícias

Continue apos a publicidade

Hot News

Um trailer recente do próximo filme de Francis Ford Coppola, “Megalópolis”, ganhou as manchetes, mas não pelos motivos que deveria.

Com o objetivo de reforçar a imagem do diretor como um iconoclasta, o trailer citou avaliações negativas de algumas das obras-primas de Coppola, como “Apocalypse Now” e “O Poderoso Chefão”, da época em que os filmes foram lançados. Havia apenas um problema — as citações não eram reais. O consultor de marketing responsável por obtê-las, evidentemente, as gerou usando inteligência artificial (IA).

Este não é o primeiro caso de destaque desta forma particular de IA — um modelo de linguagem grande (LLM) — inventando e atribuindo informações incorretamente. Vimos advogados apresentarem memoriais citando casos que não existem. Essas invenções, ou alucinações, podem ser escritas com bastante autoridade de uma forma que pode soar plausível o suficiente para as pessoas aceitarem sem pensar duas vezes. Então, quando se trata do futuro das ferramentas de busca orientadas por IA, a precisão é primordial. É por isso que, quando o The Washington Post decidiu criar uma ferramenta para ajudar os usuários a acessar melhor seu próprio arquivo, ele recrutou Naren Ramakrishnan, diretor do Sanghani Center for Artificial Intelligence and Data Analytics, sediado no Virginia Tech Innovation Campus em Alexandria.

Nem é preciso dizer que o nível de exigência para uma ferramenta como essa vinda de uma fonte como o The Washington Post precisa ser mais alto — muito mais alto — do que tem sido para alguns desses outros LLMs.

Continue após a publicidade

“Se você for usar um modelo de linguagem, é melhor ter certeza de que as respostas que você está produzindo são baseadas em alguma reportagem real que o The Washington Post tenha feito”, disse Ramakrishnan.

Ramakrishnan havia trabalhado com Sam Han, chefe de dados e IA do The Washington Post, em um projeto anterior para prever a popularidade de artigos. Eles recrutaram um grupo de estudantes da Virginia Tech para tentar prever futuras agitações sociais analisando a cobertura de notícias. Então, no outono de 2023, Han e Ramakrishnan se encontraram com o vice-presidente e diretor executivo do Innovation Campus, Lance Collins, e o então novo diretor de tecnologia do The Post, Vineet Khosla, em Alexandria.

“No ano passado, olhando para a indústria e vendo grandes mudanças chegando com modelos de linguagem e IA generativa, pensamos que poderia ser outra oportunidade de trabalhar com a Virginia Tech”, disse Han.

O objetivo é combinar a capacidade da IA ​​de sintetizar enormes quantidades de informação em conjunto com os arquivos do The Washington Post para fornecer um tipo de ferramenta de recurso de biblioteca digital que pode acessar cada parte da reportagem do jornal sobre qualquer tópico em segundos. O modelo que eles desenvolveram difere tanto dos mecanismos de busca tradicionais quanto dos LLMs que geraram tanta cobertura de notícias de várias maneiras importantes usando um processo chamado geração aumentada de recuperação.

Continue após a publicidade

Um mecanismo de busca tradicional funciona indexando todos os resultados que pode encontrar para cada palavra-chave que você dá a ele, então entregando uma mangueira de informações, dragadas de toda a web, relacionadas à combinação de termos fornecidos. LLMs abertos entregam respostas para perguntas, mas frequentemente se desviam do escopo de dados em que foram treinados.

A geração aumentada de recuperação é um processo de duas partes. Primeiro, ele pesquisa o conjunto de dados disponível — neste caso, os arquivos do The Washington Post — para histórias relacionadas à consulta. Então, ele extrai as informações exclusivamente desses artigos, executando apenas essas informações por meio de um modelo de linguagem para produzir um resumo para o usuário.

Embora a geração aumentada de recuperação extraia apenas dos arquivos do The Washington Post, ela ainda é treinada em um corpus maior, ou conjunto de dados. Isso, é claro, apresenta seus próprios desafios de confiabilidade. Mas é aí que entra a força de ter um dos principais jornais do mundo conduzindo o processo de tomada de decisão editorial neste projeto.

Continue após a publicidade

“Tínhamos tecnólogos nos dirigindo, que estavam nas mesmas salas de teste que nossos repórteres — os especialistas no assunto”, disse Phoebe Connelly, editora sênior de IA, inovação e estratégia do The Washington Post.

Continue após a publicidade

Por meio dessa colaboração, a ferramenta que o The Post e a Virginia Tech estão construindo foi projetada para evitar as maiores armadilhas que LLMs como o ChatGPT sofreram desde seu lançamento. Nem é preciso dizer que, para uma instituição como o The Post, a precisão não poderia ser mais importante. Para a Virginia Tech, o projeto apresenta uma oportunidade de levar adiante a missão do Innovation Campus de usar a IA como uma força para uma mudança positiva.

“Estabelecer confiança no espaço de informação online é uma área enorme de pesquisa”, disse Ramakrishnan. “Todo o pipeline de jornalismo tem que ser reimaginado para a revolução da IA ​​generativa.”

Dois estudantes de doutorado da Virginia Tech no Departamento de Ciência da Computação, Sha Li e Shailik Sarkar, trabalharam no projeto e depois foram estagiar no The Washington Post neste verão. Foi um momento fortuito para Sarkar, pois ele havia trabalhado na defesa contra técnicas de injeção rápida, ou os tipos de diretivas de usuário que os hackers implementam para quebrar esses tipos de ferramentas, instruindo-os a substituir sua programação original. Ele começou a trabalhar imediatamente no modelo de IA do The Post já em desenvolvimento na época, Climate Answers, que foi lançado neste verão.

“Ver isso em tempo real, em uma aplicação do mundo real, foi realmente interessante”, disse Sarkar.

Continue após a publicidade

Siga-nos nas redes sociais:

Hotnews.pt |
Facebook |
Instagram |
Telegram

#hotnews #noticias #AtualizaçõesDiárias #SigaHotnews #FiquePorDentro #ÚltimasNotícias #InformaçãoAtual

Continue após a publicidade
Continue após a publicidade

Deixe um comentário

O seu endereço de email não será publicado. Campos obrigatórios marcados com *