Freitas, Gustavo MedeirosPessin, GustavoCampos, Felipe Rigueira2023-02-162023-02-162022CAMPOS, Felipe Rigueira. Aplicação de aprendizado por reforço profundo em uma atividade de pick and place executada por um manipulador robótico de 6 graus de liberdade. 2022. 44 f. Dissertação (Mestrado Profissional em Instrumentação, Controle e Automação de Processos de Mineração) - Escola de Minas, Universidade Federal de Ouro Preto, Ouro Preto, 2022.http://www.repositorio.ufop.br/jspui/handle/123456789/16214Programa de Pós-Graduação em Instrumentação, Controle e Automação de Processos de Mineração. Departamento de Engenharia de Controle e Automação, Escola de Minas, Universidade Federal de Ouro Preto.Aplicações com robôs autônomos tem desempenhado um papel importante na indústria e na vida cotidiana. Dentre elas, as atividades de manipulação e deslocamento de objetos se destacam pela ampla variedade de possíveis aplicações. Essas atividades em ambientes estáticos conhecidos podem ser implementadas por meio de lógicas previstas pelo desenvolvedor, porém isso pode ser inviável em ambientes dinâmicos. Técnicas de Aprendizado de Máquinas têm procurado substituir a programação pré-definida pelo processo de ensinar o robô como agir, utilizando por exemplo algoritmos de Aprendizado por Reforço (AR). Esta dissertação apresenta a implementação de dois algoritmos de AR, Deep Deterministic Policy Gradient (DDPG) e Proximal Policy Optimization (PPO), para controle de orientação e posição de um manipulador robótico de 6 graus de liberdade (6-DoF). Os resultados foram analisados por meio de gráficos e simulações robóticas no software CoppeliaSim, e demonstram que o DDPG teve uma convergência mais rápida do aprendizado em atividades mais simples, porém se a complexidade do problema aumenta, ele pode não obter um comportamento satisfatório. Já o PPO consegue resolver problemas mais complexos, entretanto limita a taxa de convergência para o melhor resultado a fim de evitar instabilidade no aprendizado.pt-BRabertoRobóticaRobótica - mineraçãoRobótica - aprendizado de máquinasAplicação de aprendizado por reforço profundo em uma atividade de pick and place executada por um manipulador robótico de 6 graus de liberdade.DissertacaoAutorização concedida ao Repositório Institucional da UFOP pelo(a) autor(a) em 04/02/2023 com as seguintes condições: disponível sob Licença Creative Commons 4.0 que permite copiar, distribuir e transmitir o trabalho, desde que sejam citados o autor e o licenciante.