Veja robô em formato de cachorro se levantando após quedas forçadas
Créditos: Reprodução/Yang et al

Veja robô em formato de cachorro se levantando após quedas forçadas

Pesquisadores usaram uma abordagem baseada em aprendizagem por reforço para IA para ensinar o cão-robô Jueying

Uma equipe de pesquisadores da Universidade Zhejiang e da Universidade de Edimburgo desenvolveram um processo baseado em IA que pode ajudar seu cão-robô Jueying a se recuperar de quedas forçadas. A abordagem deles é diferente do que a Boston Dynamics fez com seu cão-robô Spot, onde ela basicamente ensinou o robô a se mover usando décadas de experiência humana para codificar, linha por linha, a maneira como um robô deve reagir a estímulos como o pé de uma pessoa.

31/12/2020 às 13:55
Notícia

Boston Dynamics coloca seus robôs pra dançar Do You Love Me? ...

"Agora que eu sei dançar, você me ama?" - perguntam os assustadores robôs do futuro

Nos métodos tradicionais para treinamento de robôs, você teria que codificar meticulosamente todos esses comportamentos especializados. Por exemplo, como os atuadores — motores que movem os membros de um robô — devem coordenar entre si para fazer a máquina correr.

"A realidade é que se você quer enviar um robô para o campo para fazer uma ampla variedade de tarefas e missões diferentes, você precisa de habilidades diferentes, certo?", disse Zhibin Li, especialista em robótica da Universidade de Edimburgo Zhibin Li, um dos autores do artigo publicado recentemente na revista Science Robotics descrevendo o sistema.

Neste artigo, Li e seus colegas detalham a abordagem baseada em aprendizagem por reforço para IA que eles usaram para permitir que seu cão-robô Jueying aprendesse a andar e se recuperar de quedas por conta própria. Primeiro os pesquisadores treinaram um software que poderia guiar uma versão virtual do robô. Para isso eles desenvolveram uma arquitetura de aprendizagem com oito "especialistas" algorítmicos que ajudam o cão-robô a produzir comportamentos complexos. 

Para cada um deles, uma rede neural profunda foi usada para treinar o modelo de computador do robô em uma habilidade específica. Por exemplo, uma focada em ensiná-lo a caminhar, outra para ensiná-lo a se levantar após uma queda e assim por diante. Se o cão-robô virtual realizasse algo que o aproximasse do objetivo, ele recebia uma recompensa virtual. Se ele fizesse algo que não fosse esperado, ele recebia um demérito digital. Este processo de aprendizado reforçado é similar ao que a Google usou para treinar seu algoritmo MuZero.


Reprodução/Yang et al

Depois que os oito especialistas algorítmicos foram treinados com sucesso, os pesquisadores utilizaram uma rede neural adicional para atuar como um “treinador principal”. Esta rede adicional basicamente gerencia as informações enviadas pelos outros oito algoritmos, priorizando um ou mais conforme necessário em uma determinada situação.

Continua após a publicidade

Com o processo concluído, eles criaram um protótipo do cão-robô Jueying, carregaram o software e iniciaram os testes. No gif abaixo é possível ver como ele se recupera de uma queda forçada rapidamente e como ele resiste a outros estímulos: 


Reprodução/Yang et al

Li disse que um dos objetivos da equipe de pesquisadores é criar máquinas mais inteligentes que combinam habilidades flexíveis e adaptativas em tempo real para lidar com uma variedade de tarefas diferentes. O desafio agora é reduzir o poder computacional necessário para simular o treinamento do robô.

Fonte: Engadget, Wired
User img

Fabio Rosolen

Samsung GALAXY S21, S21 PLUS e S21 ULTRA lançados: confira os PRINCIPAIS DESTAQUES

O que você achou deste conteúdo? Deixe seu comentário abaixo e interaja com nossa equipe. Caso queira sugerir alguma pauta, entre em contato através deste formulário.