PPGCC - Programa de Pós-graduação em Ciência da Computação

URI permanente desta comunidadehttp://www.hml.repositorio.ufop.br/handle/123456789/596

Navegar

Resultados da Pesquisa

Agora exibindo 1 - 4 de 4
  • Item
    Logo detection with second judge single shot multibox.
    (2017) Coelho, Leonardo Bombonato Simões; Cámara Chávez, Guillermo; Bianchi, Andrea Gomes Campos; Cámara Chávez, Guillermo; Ferreira, Anderson Almeida; Bianchi, Andrea Gomes Campos; Schwartz, William Robson
    With the increasing popularity of Social Networks, the way people interact has changed and the huge amount of data generated open doors to new strategies and marketing analysis. According to Instagram 1 and Tumblr2 an average of 95 and 35 million photos, respectively, are published every day. These pictures contain several implicit or explicit brand logos, this allows us to research how can a brand be better widespread based in regional, temporal and cultural criteria. Using advanced computer vision techniques for object detection and recognition, we can extract information from these images, making possible to understand the impact and the comprehensiveness of a specific brand. This thesis proposes a logo detection technique based on a Convolutional Neural Network (CNN), also used as a second judge. Our proposal is built on the Single Shot Multibox (SSD). In our research, we explored several approaches of the second judge and managed to reduce significantly the number of false positives in comparison with the original approach. Our research outperformed all the others researches on two different datasets: FlickrLogos-32 and Logos-32plus. On the FlickrLogos-32, we surpass the actual state-of-the-art method by 5.2% of F-score and for the Logos-32Plus by 3.0% of F-score.
  • Item
    Um sistema embarcado de detecção de fadiga e distração de motoristas.
    (2020) Santos, Ricardo Creonte Câmara de Meira; Oliveira, Ricardo Augusto Rabelo; Oliveira, Ricardo Augusto Rabelo; Bianchi, Andrea Gomes Campos; Correia, Luiz Henrique Andrade; Silva, Jorge Miguel Sá
    Estudos mostram que grande parte dos acidentes nas estradas são causados por falhas humanas, dentre estas falhas estão fadiga e distração dos condutores de veículos. Neste trabalho é apresentado uma proposta de sistema de detecção de fadiga e desatenção de condutores baseado em visão computacional, visando o aumento da segurança no ambiente veicular. Este sistema realiza uma análise na imagem da face do motorista. Através desta análise facial o sistema é capaz de detectar distrações e fadiga dos condutores. A detecção de distrações é realizada através da orientação (posição) da face e a fadiga é detectada através da medição da duração das piscadas e bocejos. Para a análise de piscadas é utilizada a medida PERCLOS (Percentage of Eyelid Closure). Ao detectar uma situação de risco o sistema alerta os condutores para evitar a ocorrência de acidentes. Neste trabalho é mostrada uma comparação de diferentes plataformas de desenvolvimento embarcado ao executar algoritmos de detecção e classificação de face e olhos. Esta comparação serviu para escolha do hardware utilizado no sistema embarcado. Após a escolha do hardware é apresentado a proposta de sistema e sua validação. Os testes de validação foram realizados em ambiente real com motoristas profissionais, livrando os testes de viés laboratoriais e mostrando a eficácia do sistema na detecção de situações de risco. Por fim, é apresentado como os alertas de áudio emitidos pelo sistema influenciam de maneira positiva o comportamento dos motoristas. Para isso, é comparado a diferença no comportamento dos motoristas quando o sistema está gerando os alertas de áudio e quando os alertas estão desabilitados. Os testes mostraram que ao utilizar os alertas de áudio os motoristas tendem a gerar uma quantidade menor de situações de risco.
  • Item
    Utilização de redes em cápsulas para classificação de regiões promotoras em sequências de DNA.
    (2018) Moraes, Lauro Ângelo Gonçalves de; Moreira, Gladston Juliano Prates; Moreira, Gladston Juliano Prates; Gomes, David Menotti; Santos, Thiago Oliveira dos
    Com o desenvolvimento de novas tecnologias de sequenciamento de DNA, um grande volume de informações deve ser devidamente processada e analisada. Por isso, novos estudos buscam apresentar novas técnicas para as tarefas básicas da área conhecida como bioinformática. Uma importante tarefa é a anotação genômica funcional, que necessita para seu êxito, identificar corretamente as chamadas regiões promotoras, que exercem importantes funções regulatórias de transcrição genética. Apesar de diversas metodologias terem sido propostas na literatura para a identificação destas regiões, este ainda não é um problema bem resolvido. Alguns trabalhos foram realizados utilizando diferentes arquiteturas de redes neurais artificiais. Em 2017 foi apresentada para o mundo uma arquitetura baseada em cápsulas, bastante diferente das tradicionais, que se mostrou bastante eficiente em processar imagens de dígitos. Entretanto, ainda faltam aplicações e validações deste modelo em outras áreas. Na área de bioinformática ainda não há registros do uso de redes em cápsulas, assim, este trabalho realiza uma experimentação deste novo modelo para o problema de classificação de regiões promotoras em DNA. Utilizando duas bases de dados de organismos procariontes e cinco de eucariontes, foram testadas uma arquitetura convolucional retirada da literatura e uma arquitetura em cápsulas desenvolvida neste trabalho. Os modelos foram testados e suas capacidades preditivas descritas, segundo diferentes tipos de métricas. Os resultados mostram que as redes em cápsulas obtiveram bons resultados nos testes e são comparáveis com a rede convolucional da literatura atual.
  • Item
    Desenvolvimento de uma abordagem para o reconhecimento de gestos manuais dinâmicos e estáticos.
    (2015) Escobedo Cárdenas, Edwin Jonathan; Cámara Chávez, Guillermo
    Durante os últimos anos, têm sido desenvolvidas diversas abordagens para o reconhecimento de gestos manuais, tanto estáticos como dinâmicos. Todas com o objetivo de melhorar a interação homem-computador. Muitas dessas abordagens, inicialmente baseados nas informações de intensidade, não fornecem dados suficientes para uma boa caracterização. Devido ao avanço da tecnologia, novos dispositivos estão surgindo como é o caso do sensor Kinect o qual, além da informação de intensidade, provê as informações de profundidade e posições das articulações do corpo. Dessa maneira, obtém-se uma maior vantagem no desenvolvimento de um modelo para reconhecimento de gestos, pois ajuda reduzindo alguns processos complexos como é o caso da segmentação e localização da mão. Contudo as novas informações de profundidade e posição podem também ser usadas para a geração de novas características e melhorar as taxas de reconhecimento. Nesta dissertação apresentamos dois modelos para o reconhecimento de gestos, tanto estáticos como dinâmicos, usando as informações de intensidade e profundidade (RGBD), além da informação das posições das principais articulações do corpo. No modelo para reconhecer gestos estáticos, usou-se a informação de profundidade, propondo um método baseado na representação da mão em uma nuvem de pontos. Logo, usando a teoria de cossenos de direção, gerou-se um vetor de Histogramas de Magnitudes Acumuladas, o qual representa as novas características locais da mão. Finalmente, usando o classificador SVM (Support Vector Machine), geraram-se resultados superiores a outros modelos da literatura, sendo o melhor resultado de 99.21% de acurácia media. No modelo para reconhecer gestos dinâmicos, usou-se a informação das posições da mão para gerar a trajetória do gesto e propor um algoritmo de extração de quadros principais, evitando assim o uso reiterado de técnicas invariáveis ao tempo como os Hidden Markov Models (HMM) ou Dinamyc Time Warping (DTW). Depois, geraram-se três vetores: o vetor de informação espacial VSI , o vetor de informação temporal VTI e o vetor de mudanças da posição da mão VHC, os quais representam as características globais do gesto. Também, o descritor local SIFT foi usado nas imagens de intensidade e profundidade para obter características das mãos. A partir dessas características, foram gerados atributos de nível médio usando a técnica Bag-of-Words (BoW), gerando o vetor de características locais. Esse modelo foi testado usando o classificador SVM (Support Vector Machine) usando três bases de dados diferentes, gerando resultados superiores a outros modelos da literatura em cada caso (100%, 88.38% e 98.28%).