CasaInformaçõesRobôs de treinamento para movimentos atléticos

Robôs de treinamento para movimentos atléticos



Os robôs podem se mover como atletas?Um novo modelo de treinamento os ajuda a replicar movimentos esportivos, mas os resultados mostram progresso e desafios inesperados.

Uma equipe de pesquisadores de IA e robótica da Carnegie Mellon University, juntamente com dois colegas da Nvidia, criou um novo modelo para treinar robôs para se mover como atletas humanos.A equipe observou que a maioria do treinamento robótico se concentra na locomoção, levando a robôs que se movem com eficiência, mas sem fluidez ou atletismo.Para abordar isso, eles exploraram o treinamento de corpo inteiro.Eles descobriram que os modelos existentes careciam de adaptabilidade e confiam em muitos parâmetros, tornando os movimentos de robôs excessivamente cautelosos.Isso os levou a desenvolver uma nova estrutura de treinamento em duas etapas.

O primeiro estágio treina um módulo de IA para analisar vídeos de movimento humano de corpo inteiro, ajustando os movimentos-chave para atender às capacidades do robô usando rastreamento de movimento.O segundo estágio reúne dados do mundo real para preencher a lacuna entre o movimento humano nos vídeos e como os robôs podem se mover fisicamente.Esse processo levou a uma estrutura chamada simulação de alinhamento e física real (ASAP).

A estrutura o mais rápido possível consiste em quatro etapas.Primeiro, a coleção de pré-treinamento e trajetória real de rastreamento de movimento envolve o redirecionamento de movimentos humanóides de vídeos humanos.Múltiplas políticas de rastreamento de movimento são pré-treinadas para gerar trajetórias de movimento do mundo real.Em seguida, o treinamento do modelo de ação da Delta é realizado usando dados de lançamento do mundo real.Esta etapa minimiza a discrepância entre o estado simulado e o estado real do mundo real, melhorando a precisão do modelo.

No estágio de ajuste fino da política, o modelo de ação Delta é congelado e integrado ao simulador para se alinhar melhor à física do mundo real.A política de rastreamento de movimento pré-treinada é então ajustada para maior precisão.Finalmente, na implantação do mundo real, a política de ajuste fina é implementada diretamente no mundo real sem depender do modelo de ação da Delta, garantindo que o robô possa executar seus movimentos treinados de forma independente.

Para testar a estrutura, os pesquisadores treinaram um robô para replicar movimentos esportivos icônicos.Ele realizou o arremesso de photo de Fadeaway de Kobe Bryant, o movimento do silenciador de LeBron James e o salto SIU de Cristiano Ronaldo com um giro no ar.Cada movimento foi registrado.

Os movimentos do robô se assemelham claramente aos famosos movimentos esportivos, destacando o progresso em movimento de corpo inteiro.No entanto, também é evidente que muito mais trabalho é necessário antes que um robô possa ser confundido com um atleta profissional.