Maio 12, 2025
OpenAI provoca ‘Sora’, seu novo protótipo de IA de texto para vídeo

OpenAI provoca ‘Sora’, seu novo protótipo de IA de texto para vídeo

Continue apos a publicidade

Quero ver uma tartaruga andando de bicicleta pelo oceano? Agora, a IA generativa pode animar essa cena em segundos.

A OpenAI revelou na quinta-feira seu novo protótipo de texto para vídeo Sora, que pode gerar vídeos de até um minuto com base em qualquer solicitação que o usuário digite em uma caixa de texto. Embora ainda não esteja disponível ao público, o proclamação da empresa de IA provocou um repelo de reações online.

Os entusiastas da IA ​​foram rápidos a debater ideias sobre o potencial desta tecnologia mais recente, mesmo quando outros levantaram preocupações imediatas sobre a forma uma vez que a sua acessibilidade poderia minar os empregos humanos e promover a propagação da desinformação do dedo.

O CEO da OpenAI, Sam Altman, solicitou ideias imediatas sobre o X e gerou uma série de vídeos incluindo os ciclistas aquáticos mencionados, muito uma vez que um vídeo de culinária e podcasting de alguns cachorros Em uma serra.

Continue após a publicidade

“Não disponibilizaremos nascente protótipo amplamente em nossos produtos em breve”, escreveu um porta-voz da OpenAI por e-mail, acrescentando que a empresa está compartilhando seu progresso de pesquisa agora para obter feedback antecipado de outros membros da comunidade de IA.

A empresa, com seu popular chatbot ChatGPT e gerador de texto para imagem DALL-E, é uma das várias startups de tecnologia que lideram a revolução da IA ​​​​generativa que começou em 2022. Ela escreveu em uma postagem de blog que Sora pode gerar vários caracteres com precisão e diferentes tipos de movimento.

“Estamos ensinando IA a compreender e simular o mundo físico em movimento, com o objetivo de treinar modelos que ajudem as pessoas a resolver problemas que exigem interação no mundo real”, escreveu OpenAI no post.

Mas Sora pode ter dificuldade para tomar os detalhes físicos ou espaciais de uma cena mais complexa, o que pode levá-la a gerar um pouco ilógico (uma vez que uma pessoa correndo na direção errada em uma esteira), transformar um objeto de maneira não oriundo ou até mesmo provocar isso. vanescer do zero, disse a empresa em seu blog.

Continue após a publicidade

Ainda assim, muitas das demonstrações partilhadas pela OpenAI apresentavam detalhes visuais hiper-realistas que poderiam dificultar aos utilizadores casuais da Internet notabilizar vídeos gerados por IA de imagens da vida real. Os exemplos incluem uma filmagem de drone de ondas quebrando na costa escarpada de Big Sur sob o clarão do sol poente e um clipe de uma mulher passeando por uma rua movimentada de Tóquio ainda úmida de chuva.

À medida que a mídia falsa de celebridades, políticos e figuras privadas se torna cada vez mais preponderante online, as implicações éticas e de segurança de um mundo em que qualquer pessoa pode produzir vídeos de subida qualidade de qualquer coisa que possa imaginar – principalmente durante um ano de eleições presidenciais e em meio a tensos conflitos globais repletas de oportunidades de desinformação – são assustadoras.

A Percentagem Federalista de Negócio propôs na quinta-feira regras destinadas a tornar ilícito a geração de impressões de IA de pessoas reais, estendendo as proteções que está implementando em torno da representação governamental e empresarial.

Continue após a publicidade

“A filial está tomando esta ação à luz do aumento de reclamações sobre fraude de falsificação de identidade, muito uma vez que do clamor público sobre os danos causados ​​aos consumidores e aos indivíduos personificados”, escreveu a FTC em um enviado à prelo. “A tecnologia emergente – incluindo deepfakes gerados por IA – prenúncio turbinar esse flagelo, e a FTC está comprometida em usar todas as suas ferramentas para detectar, impedir e impedir fraudes de falsificação de identidade.”

Continue após a publicidade
Aviso: Vários mamutes peludos gigantes se aproximam caminhando por um prado nevado, seu longo pelo lanoso balança levemente ao vento enquanto caminham, árvores cobertas de neve e montanhas cobertas de neve dramáticas ao longe, luz do meio da tarde com nuvens finas e um sol alto ao longe cria um brilho quente, a visão baixa da câmera é impressionante, capturando o grande mamífero peludo com uma bela fotografia e profundidade de campo.
Aviso: Vários mamutes peludos gigantes se aproximam caminhando por um prado nevado, seu longo pelo lãzudo balança levemente ao vento enquanto caminham, árvores cobertas de neve e montanhas cobertas de neve dramáticas ao longe, luz do meio da tarde com nuvens finas e um sol cumeeira ao longe cria um clarão quente, a visão baixa da câmera é impressionante, capturando o grande mamífero peludo com uma bela retrato e profundidade de campo.OpenAI

A OpenAI disse que está trabalhando para erigir ferramentas que possam detectar quando um vídeo é gerado por Sora, e planeja incorporar metadados, que marcariam a origem de um vídeo, em tal teor se o protótipo for disponibilizado para uso público no porvir.

A empresa também disse que está colaborando com especialistas para testar Sora quanto à sua capacidade de provocar danos por meio de desinformação, teor de ódio e preconceito.

Um porta-voz da OpenAI disse à NBC News que publicará logo um cartão do sistema descrevendo suas avaliações de segurança, muito uma vez que os riscos e limitações do protótipo.

“Apesar de extensas pesquisas e testes, não podemos prever todas as maneiras benéficas pelas quais as pessoas usarão nossa tecnologia, nem todas as maneiras pelas quais as pessoas irão exorbitar dela”, disse OpenAI em seu blog. “É por isso que acreditamos que aprender com o uso no mundo real é um componente crítico para produzir e lançar sistemas de IA cada vez mais seguros ao longo do tempo.”

Continue após a publicidade

Continue após a publicidade

Fonte

Continue após a publicidade

Deixe um comentário

O seu endereço de email não será publicado. Campos obrigatórios marcados com *