Controle de um Robô Móvel com Pêndulo Invertido por Meio de Aprendizado por Reforço
Resumo
Este trabalho apresenta o conceito de Aprendizado por Reforço aplicado ao problema do pêndulo invertido preso a um robô móvel (problema conhecido como Cart Pole em inglês). Nesse problema, o robô deve aprender as melhores ações para manter o pêndulo em equilíbrio. Os algoritmos de Aprendizado por Reforço utilizados nesse projeto foram o Q-Learning, Q-Learning com heurística (HAQL) e o Deep Q Network (DQN). Os resultados experimentais demonstraram que os três algoritmos analisados puderam resolver com sucesso o problema de controle proposto, contudo o HAQL e o DQN alcançaram resultados mais promissores.
Copyright (c) 2024 REVISTA CEREUS
This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License.
DECLARAÇÃO DE TRANSFERÊNCIA DE DIREITOS AUTORAIS
Os autores do manuscrito submetido declaram ter conhecimento que em caso de aceitação do artigo, a Revista Cereus, passa a ter todos os direitos autorais sobre o mesmo. O Artigo será de propriedade exclusiva da Revista, sendo vedada qualquer reprodução, em qualquer outra parte ou meio de divulgação, impressa ou eletrônica.