A novidade perceptibilidade sintético (IA) da Anthropic Cláudio 3 modelos vencer concorrentes em muitas áreas, disseram especialistas à PYMNTS.
A empresa, que lançou os modelos na segunda-feira (4 de março), afirma que Claude 3 Opus – o mais avançado entre os novos modelos – superou o GPT-4 da OpenAI e o Gemini Ultra do Google nas avaliações de benchmark do setor. As avaliações abrangeram áreas uma vez que conhecimentos de graduação, raciocínio de pós-graduação e matemática básica.
Os novos modelos significam a intensificação da concorrência entre as empresas de IA para fazer progredir as suas tecnologias num sector cada vez mais aquecido.
“Claude supera o GPT-4 em quase todas as áreas”, Richard Gardner, CEO da empresa de consultoria de tecnologia Módulodisse PYMNTS em uma entrevista.
“No entanto, sentimos que a categoria de alinhamento de Claude é excessivamente restritiva. Dito isto, a categoria de alinhamento do GPT-4 também está se tornando muito restritiva”, disse ele, acrescentando que prefere usar modelos de código lhano.
Novos recursos do Antrópico
As novas ferramentas de IA da Anthropic dentro da família Claude 3 são chamadas Opus, Sonnet e Haiku. Os modelos Sonnet e Haiku são mais simples e baratos que o Opus. Sonnet e Opus estão disponíveis em 159 países, e o Haiku será lançado em breve, disse a Anthropic. A empresa não divulgou quanto tempo ou quanto custou para desenvolver o Claude 3, mas mencionou que empresas uma vez que Airtable e Asana ajudaram a testar os modelos.
Pela primeira vez, a Anthropic permite aos usuários explorar diversos tipos de dados, incluindo fotos, gráficos e documentos, por meio de seu novo recurso de suporte multimodal.
Os testes mostram que Claude 3 é melhor na geração de código-fonte em verificação com outros modelos, Caleb Moore, o cofundador e diretor de tecnologia da empresa de software Darwinium, disse PYMNTS em uma entrevista.
“Outros fatores comuns são a verificação do raciocínio (a capacidade de chegar a uma peroração lógica com base em informações inter-relacionadas que lhe são fornecidas), muito uma vez que a profundidade do conhecimento já codificado no sistema que pode utilizar”, acrescentou.
Confrontar modelos de IA pode ser complicado, diz Ilia Badeev, dirigente de ciência de dados da Grupo Trevoluçãouma empresa de serviços de viagens que usa IA, disse à PYMNTS em entrevista.
“As pessoas muitas vezes confiam em testes públicos para verificação, mas estes testes são bastante abstratos e nem sempre refletem cenários do mundo real”, disse Badeev. “Só porque um protótipo se destaca em alguns testes não significa que será perfeito para suas tarefas específicas.”
Escolhendo modelos de IA
Um ponto importante a considerar ao escolher um protótipo de IA é o dispêndio, destacou Badeev. Por exemplo, Claude 3 Opus custará US$ 75 por um milhão de tokens – significativamente mais do que o GPT-4 Turbo, ao preço de US$ 30 pelo mesmo volume.
Gardner disse que quase qualquer protótipo pode ser ajustado para dar suporte a um caso de uso mercantil específico. Alguns modelos podem ser melhores que outros para tarefas específicas, mas isso se deve principalmente ao ajuste fino, observou ele, citando aplicativos projetados especificamente para gerenciar anotações clínicas ou para ajudar profissionais de saúde.
As empresas devem escolher um protótipo de IA fundamentado na precisão, velocidade, privacidade, facilidade de implantação ou manutenção e dispêndio, disse Gardner, acrescentando que os modelos de código lhano proporcionam mais privacidade aos usuários.
Para escritores criativos, os recursos do GPT-4 na geração de texto podem ser mais úteis, disse Michal Oglodek, diretor de tecnologia da Ivy.aidisse PYMNTS em uma entrevista. Por outro lado, se o usuário procura precisão e manutenção da consistência da marca, o Gemini 1, com foco na verdade e segurança, pode ser a escolha preferível. E para usuários que precisam mourejar com questões complexas com precisão, o Claude 3 pode oferecer vantagens.
“Sempre que provável, teste os modelos diretamente em sua emprego”, disse Oglodek. “Os benchmarks são informativos, mas o uso no mundo real fornece uma imagem mais precisa.”
Para toda a cobertura PYMNTS AI, assine o quotidiano Boletim informativo sobre IA.