Abril 4, 2025
A IA de código aberto deve revelar seus dados de treinamento, de acordo com a nova definição do OSI
 #ÚltimasNotícias #tecnologia

A IA de código aberto deve revelar seus dados de treinamento, de acordo com a nova definição do OSI #ÚltimasNotícias #tecnologia

Continue apos a publicidade

Hot News

A Open Source Initiative (OSI) divulgou a sua definição oficial de inteligência artificial “aberta”, preparando o terreno para um confronto com gigantes da tecnologia como a Meta – cujos modelos não se enquadram nas regras.

A OSI há muito define o padrão da indústria para o que constitui software de código aberto, mas os sistemas de IA incluem elementos que não são cobertos por licenças convencionais, como dados de treinamento de modelo. Agora, para que um sistema de IA seja considerado verdadeiramente de código aberto, ele deve fornecer:

  • Acesso a detalhes sobre os dados usados ​​para treinar a IA para que outros possam entendê-los e recriá-los
  • O código completo usado para construir e executar a IA
  • As configurações e pesos do treinamento, que ajudam a IA a produzir seus resultados

Esta definição desafia diretamente o Llama da Meta, amplamente promovido como o maior modelo de IA de código aberto. O Llama está disponível publicamente para download e uso, mas tem restrições de uso comercial (para aplicativos com mais de 700 milhões de usuários) e não fornece acesso a dados de treinamento, fazendo com que fique aquém dos padrões da OSI para liberdade irrestrita de usar, modificar, e compartilhe.

A porta-voz da Meta, Faith Eischen, disse A beira que embora “concordemos com nosso parceiro OSI em muitas coisas”, a empresa discorda dessa definição. “Não existe uma definição única de IA de código aberto, e defini-la é um desafio porque as definições anteriores de código aberto não abrangem as complexidades dos atuais modelos de IA em rápido avanço.”

Continue após a publicidade

“Continuaremos trabalhando com a OSI e outros grupos da indústria para tornar a IA mais acessível e gratuita de forma responsável, independentemente das definições técnicas”, acrescentou Eischen.

Durante 25 anos, a definição de software de código aberto da OSI tem sido amplamente aceita por desenvolvedores que desejam desenvolver o trabalho uns dos outros sem medo de ações judiciais ou armadilhas de licenciamento. Agora, à medida que a IA remodela o cenário, os gigantes da tecnologia enfrentam uma escolha fundamental: abraçar estes princípios estabelecidos ou rejeitá-los. A Linux Foundation também fez uma tentativa recente de definir “IA de código aberto”, sinalizando um debate crescente sobre como os valores tradicionais de código aberto se adaptarão à era da IA.

“Agora que temos uma definição robusta em vigor, talvez possamos reagir de forma mais agressiva contra as empresas que estão ‘limpando abertamente’ e declarando seu trabalho de código aberto, quando na verdade não o é”, Simon Willison, pesquisador independente e criador do código aberto -source Datasette multiferramenta, contado A beira.

O CEO da Hugging Face, Clément Delangue, chamou a definição da OSI de “uma grande ajuda para moldar a conversa sobre abertura na IA, especialmente quando se trata do papel crucial dos dados de treinamento”.

Continue após a publicidade

O diretor executivo da OSI, Stefano Maffulli, diz que a iniciativa levou dois anos, consultando especialistas em todo o mundo, para refinar esta definição através de um processo colaborativo. Isso envolveu trabalhar com especialistas acadêmicos em aprendizado de máquina e processamento de linguagem natural, filósofos, criadores de conteúdo do mundo Creative Commons e muito mais.

Continue após a publicidade

Embora a Meta cite preocupações de segurança para restringir o acesso aos seus dados de treino, os críticos veem um motivo mais simples: minimizar a sua responsabilidade legal e salvaguardar a sua vantagem competitiva. Muitos modelos de IA são quase certamente treinados em material protegido por direitos autorais; em abril, O jornal New York Times relatou que a Meta reconheceu internamente que havia conteúdo protegido por direitos autorais em seus dados de treinamento “porque não temos como não coletar isso”. Há uma série de ações judiciais contra Meta, OpenAI, Perplexity, Anthropic e outras por suposta violação. Mas, com raras exceções – como o Stable Diffusion, que revela seus dados de treinamento – os demandantes devem atualmente confiar em evidências circunstanciais para demonstrar que seu trabalho foi eliminado.

Enquanto isso, Maffulli vê a história do código aberto se repetindo. “A Meta está apresentando os mesmos argumentos” que a Microsoft fez na década de 1990, quando viu o código aberto como uma ameaça ao seu modelo de negócios, disse Maffulli. A beira. Ele se lembra de Meta lhe contando sobre seu investimento intensivo na Llama, perguntando-lhe “quem você acha que será capaz de fazer a mesma coisa?” Maffulli viu um padrão familiar: um gigante da tecnologia usando custos e complexidade para justificar manter sua tecnologia trancada. “Voltamos aos primeiros dias”, disse ele.

“Esse é o segredo deles”, disse Maffulli sobre os dados de treinamento. “É o IP valioso.”

Continue após a publicidade

Siga-nos nas redes sociais:

Hotnews.pt |
Facebook |
Instagram |
Telegram

#hotnews #noticias #tecnologia #AtualizaçõesDiárias #SigaHotnews #FiquePorDentro #ÚltimasNotícias #InformaçãoAtual

Continue após a publicidade
Continue após a publicidade

Deixe um comentário

O seu endereço de email não será publicado. Campos obrigatórios marcados com *