Controle de um Robô Móvel com Pêndulo Invertido por Meio de Aprendizado por Reforço

Resumo

Este trabalho apresenta o conceito de Aprendizado por Reforço aplicado ao problema do pêndulo invertido preso a um robô móvel (problema conhecido como Cart Pole em inglês). Nesse problema, o robô deve aprender as melhores ações para manter o pêndulo em equilíbrio. Os algoritmos de Aprendizado por Reforço utilizados nesse projeto foram o Q-Learning, Q-Learning com heurística (HAQL) e o Deep Q Network (DQN). Os resultados experimentais demonstraram que os três algoritmos analisados puderam resolver com sucesso o problema de controle proposto, contudo o HAQL e o DQN alcançaram resultados mais promissores.

Biografia do Autor

Danilo Hernani Perico, Centro Universitário FEI

Possui Graduação, Mestrado e Doutorado em Engenharia Elétrica pelo Centro Universitário FEI (2009, 2012 e 2017). Tem experiência na área de Inteligência Artificial e Robótica, atuando principalmente nos seguintes temas: Aprendizagem de Máquina, Robótica Móvel, Robôs Humanoides, Robótica Probabilística e Raciocínio Espacial. Atualmente é secretário do Capítulo Profissional da Sociedade de Robótica e Automação do IEEE na seção Sul Brasil, é coordenador da Competição Brasileira de Robótica (CBR), é professor do Departamento de Ciência da Computação e coordenador do curso de Engenharia de Robôs no Centro Universitário FEI.

Publicado
2024-09-28
Como Citar
de Moraes, M. L., da Silva, I. J., & Perico, D. H. (2024). Controle de um Robô Móvel com Pêndulo Invertido por Meio de Aprendizado por Reforço. REVISTA CEREUS, 16(3), 182-196. Recuperado de http://ojs.unirg.edu.br/index.php/1/article/view/4941
Seção
Artigos