PPGCC - Mestrado (Dissertações)

URI permanente para esta coleçãohttp://www.hml.repositorio.ufop.br/handle/123456789/597

Navegar

Resultados da Pesquisa

Agora exibindo 1 - 4 de 4
  • Item
    Logo detection with second judge single shot multibox.
    (2017) Coelho, Leonardo Bombonato Simões; Cámara Chávez, Guillermo; Bianchi, Andrea Gomes Campos; Cámara Chávez, Guillermo; Ferreira, Anderson Almeida; Bianchi, Andrea Gomes Campos; Schwartz, William Robson
    With the increasing popularity of Social Networks, the way people interact has changed and the huge amount of data generated open doors to new strategies and marketing analysis. According to Instagram 1 and Tumblr2 an average of 95 and 35 million photos, respectively, are published every day. These pictures contain several implicit or explicit brand logos, this allows us to research how can a brand be better widespread based in regional, temporal and cultural criteria. Using advanced computer vision techniques for object detection and recognition, we can extract information from these images, making possible to understand the impact and the comprehensiveness of a specific brand. This thesis proposes a logo detection technique based on a Convolutional Neural Network (CNN), also used as a second judge. Our proposal is built on the Single Shot Multibox (SSD). In our research, we explored several approaches of the second judge and managed to reduce significantly the number of false positives in comparison with the original approach. Our research outperformed all the others researches on two different datasets: FlickrLogos-32 and Logos-32plus. On the FlickrLogos-32, we surpass the actual state-of-the-art method by 5.2% of F-score and for the Logos-32Plus by 3.0% of F-score.
  • Item
    Detecção de solos contaminados : uma proposta utilizando aprendizado de máquina em imagens hiperespectrais.
    (2021) Duarte, Fernando Henrique Oliveira; Pessin, Gustavo; Pabón, Rosa Elvira Correa; Pessin, Gustavo; Pabón, Rosa Elvira Correa; Bianchi, Andrea Gomes Campos; Souza, Jefferson Rodrigo de
    Sensoriamento remoto em locais onde podem ocorrer contaminação de solo por meio de óleos brutos, podem ganhar um reforço com processos ágeis e não destrutivos de caracterização dos compostos. Há interesse em mapear solos em busca de vazamento de óleo por empresas que querem minimizar a perda de matéria-prima e a contaminação do meio ambiente. A identificação da composição de contaminantes e solos ´e comumente realizada por métodos tradicionais em laboratório, tais métodos são precisos, invasivos e demandam de conhecimento t´técnico e equipamentos para análise. Métodos que utilizam imagens espectrais são não invasivos, rápidos e podem ser realizados em campo ou laboratório. O objetivo deste estudo é desenvolver uma abordagem de teste de solo econômica, rápida, não invasiva e autônoma, utilizando dados coletados através da espectroscopia de ondas infravermelhas que alimenta nossos modelos Machine Learning na identificação de solos crus e contaminados por óleos (petróleo bruto) identificando o solo, o contaminante e a concentração. A biblioteca de dados hiper espectral alimenta o desenvolvimento de um algoritmo de aprendizagem de máquina, a fim de classificar solos, óleos e suas concentrações. Assim, automatizando o mapeamento de infiltrações e vazamentos em terra. Propomos três fluxos de aprendizado com modelos Random Forest que apresentam resultados com acurácia acima de 90%. Os testes foram realizados utilizando três diferentes tipos de dados, que indicam o maior benefício de desempenho quando utiliza-se os dados filtrados com o método contínuo removido (espectro normalizado) na identificação de solos e contaminantes. Na identificação da concentração os dados filtrados pela média apresentaram melhor resultado. Os resultados dos testes do fluxo de aprendizado dependente, indicam taxa de acerto média de 98% na classificação dos solos, 94% na classificação dos contaminantes e 93% na classificação das concentrações. Outras métricas como F1-Score, Revocação e Precisão apresentam resultados específicos de cada rótulo, evidenciando o desempenho dos classificadores ao identificá-los. O desempenho dos fluxos de aprendizado manifestara resultados constantes, com baixa variância e dispersão, e taxas de acerto acima de 93% no geral. Os resultados apresentados, sugerem que a tecnologia tem grande potencial de uso no monitoramento ambiental de solos, ao longo de dutos e refinarias a procura de vazamentos.
  • Item
    Reconhecimento de caracteres em imagens com ruído usando Deep Learning.
    (2017) Peixoto, Sirlene Pio Gomes da Silva; Gomes, David Menotti; Gomes, David Menotti; Bianchi, Andrea Gomes Campos; Cámara Chávez, Guillermo; Todt, Eduardo; Ferreira, Anderson Almeida
    Devido à degradação e baixa qualidade em imagens com ruído, como imagens de cenas naturais e CAPTCHAs (Completely Automated Public Turing test to tell Computers and Humans Apart) baseados em texto, o problema de reconhecimento de caracteres continua a ser extremamente desafiador. Neste trabalho, estudamos três abordagens diferentes de redes convolucionais (otimização de arquitetura com filtros aleatórios, aprendizado de filtros não supervisionado e supervisionado) que visam melhorar as representações de característica dessas imagens por meio de deep learning. Nós realizamos experimentos no amplamente utilizado dataset The Street View House Numbers (SVHN), em um novo dataset de CAPTCHAS criado por nós, e em um dataset de placas brasileiras. A abordagem que aprende os pesos dos filtros por meio do algoritmo back-propagation utilizando a técnica data augmentation e a estratégia de agregação de algumas camadas localmente conectadas à rede convolucional obteve resultados promissores para o dataset CAPTCHA (97,36% de acurácia para caracteres e 85,4% para CAPTCHAs) e resultados muito próximos ao estado da arte em relação ao dataset SVHN (97,45 % de acurácia para dígitos). Já no dataset de placas brasileiras, que contém um número de amostras muito inferior aos demais, a abordagem que realiza a otimização de arquitetura com filtros aleatórios obteve os resultados mais promissores. Além disso, analisamos o comportamento da abordagem deep learning que realiza o aprendizado supervisionado de filtros diante da exposição do dataset SVHN a interferências adversas.
  • Item
    Fusão de características na re-identificação de pessoas.
    (2018) Sales, Anderson Luís Cavalcanti; Cámara Chávez, Guillermo; Cámara Chávez, Guillermo; Ferreira, Anderson Almeida; Bianchi, Andrea Gomes Campos; Schwartz, William Robson
    Re-Identi cação de pessoas é um problema de correspondência entre identidades capturadas por câmeras de vigilância não sobrepostas. Essa correspondência, também conhecida como rastreamento multi-câmeras é uma tarefa da área de visão computacional. Tem grande foco por se tratar, principalmente, de demandas nas esferas de segurança pública e/ou pessoal. Esse foco se dá em vista das possíveis incapacidades humanas na realização de tarefas repetitivas por um tempo prolongado, por exemplo. Intenciona-se com essa abordagem suavizar, quão possível, os custos inerentes ao processo computacional tradicional. A abordagem proposta é fracionada em duas partes: aprendizado de um espaço métrico de baixa dimensionalidade (denominado fase inicial) e reorganização de rank de amostras a partir de uma classi cação binária ponderada, a m de reduzir a incompatibilidade entre várias câmeras. Usa-se handcrafted image descriptors como ferramentas. Adicionalmente, emprega-se na abordagem proposta, um modelo de aprendizado métrico discriminante para representar features em uma nova dimensão; aprendizado métrico de similaridade em larga escala e distância métrica para construção dos ranks primários entre amostras de teste e imagens da galeria. Em todo o trabalho as imagens amostrais foram divididas a partir da imagem original em secções, a m de aumentar a discriminação entre as amostras.