Setembro 28, 2024
A IA generativa leva os robôs um passo mais perto do propósito universal

A IA generativa leva os robôs um passo mais perto do propósito universal


A maior segmento da cobertura da robótica humanóide concentrou-se compreensivelmente no design de hardware. Dada a frequência com que seus desenvolvedores usam a frase “humanóides de uso universal”, mais atenção deveria ser dada à primeira segmento. Depois décadas de sistemas de propósito único, o salto para sistemas mais generalizados será grande. Só não chegamos lá ainda.

O impulso para produzir uma perceptibilidade robótica que possa aproveitar totalmente a ampla gama de movimentos abertos pelo design humanóide bípede tem sido um tópico chave para os pesquisadores. O uso de IA generativa em robótica também tem sido um objecto em subida recentemente. Uma novidade pesquisa do MIT aponta uma vez que esta última pode afetar profundamente a primeira.

Um dos maiores desafios no caminho para sistemas de uso universal é o treinamento. Temos um conhecimento sólido das melhores práticas para treinar humanos em uma vez que realizar diferentes trabalhos. As abordagens da robótica, embora promissoras, são fragmentadas. Existem muitos métodos promissores, incluindo aprendizagem por reforço e imitação, mas as soluções futuras provavelmente envolverão combinações desses métodos, aumentadas por modelos generativos de IA.

Um dos principais casos de uso sugeridos pela equipe do MIT é a capacidade de coletar informações relevantes desses pequenos conjuntos de dados específicos de tarefas. O método foi denominado de formação de políticas (PoCo). As tarefas incluem ações úteis do robô, uma vez que sovar um prego e virar coisas com uma espátula.

“[Researchers] treinar um protótipo de divulgação separado para aprender uma estratégia, ou política, para completar uma tarefa usando um conjunto de dados específico”, observa a escola. “Em seguida, eles combinam as políticas aprendidas pelos modelos de divulgação em uma política universal que permite que um robô execute múltiplas tarefas em vários ambientes.”

De concordância com o MIT, a incorporação de modelos de divulgação melhorou o desempenho das tarefas em 20%. Isso inclui a capacidade de executar tarefas que requerem múltiplas ferramentas, muito uma vez que aprender/adaptar-se a tarefas desconhecidas. O sistema é capaz de combinar informações pertinentes de diferentes conjuntos de dados em uma ergástulo de ações necessárias para executar uma tarefa.

“Um dos benefícios desta abordagem é que podemos combinar políticas para obter o melhor dos dois mundos”, afirma o responsável principal do item, Lirui Wang. “Por exemplo, uma política treinada em dados do mundo real pode ser capaz de compreender mais destreza, enquanto uma política treinada em simulação pode ser capaz de compreender mais generalização.”

O objetivo deste trabalho específico é a geração de sistemas de perceptibilidade que permitam aos robôs trocar diferentes ferramentas para realizar diferentes tarefas. A proliferação de sistemas multifuncionais levaria a indústria um passo mais perto do sonho de uso universal.



Fonte

Deixe um comentário

O seu endereço de email não será publicado. Campos obrigatórios marcados com *