Controle de um Robô Móvel com Pêndulo Invertido por Meio de Aprendizado por Reforço
Resumen
Este trabalho apresenta o conceito de Aprendizado por Reforço aplicado ao problema do pêndulo invertido preso a um robô móvel (problema conhecido como Cart Pole em inglês). Nesse problema, o robô deve aprender as melhores ações para manter o pêndulo em equilíbrio. Os algoritmos de Aprendizado por Reforço utilizados nesse projeto foram o Q-Learning, Q-Learning com heurística (HAQL) e o Deep Q Network (DQN). Os resultados experimentais demonstraram que os três algoritmos analisados puderam resolver com sucesso o problema de controle proposto, contudo o HAQL e o DQN alcançaram resultados mais promissores.
Derechos de autor 2024 REVISTA CEREUS
Esta obra está bajo licencia internacional Creative Commons Reconocimiento-NoComercial-SinObrasDerivadas 4.0.
DECLARAÇÃO DE TRANSFERÊNCIA DE DIREITOS AUTORAIS
Os autores do manuscrito submetido declaram ter conhecimento que em caso de aceitação do artigo, a Revista Cereus, passa a ter todos os direitos autorais sobre o mesmo. O Artigo será de propriedade exclusiva da Revista, sendo vedada qualquer reprodução, em qualquer outra parte ou meio de divulgação, impressa ou eletrônica.