PPGCC - Mestrado (Dissertações)
URI permanente para esta coleçãohttp://www.hml.repositorio.ufop.br/handle/123456789/597
Navegar
Item Algoritmos de aprendizado de máquina para previsão de tempo da manutenção de vagões.(2022) Felix, Josemar Coelho; Silva, Rodrigo César Pedrosa; Silva, Rodrigo César Pedrosa; Bianchi, Andrea Gomes Campos; Nucci, Edson Romano; Pereira, Robson Bruno DutraA análise do planejamento de manutenção, com o objetivo de criar predições sobre a capacidade produtiva, é uma importante aliada na gestão industrial. A Engenharia de Métodos dispõe da ferramenta denominada cronoanálise, utilizada desde 1856, para avaliar a capacidade industrial. Essa ferramenta tem como base a cronometragem e análise subjetiva de várias atividades envolvidas nas atividades de produção da manutenção. Contudo, o próprio processo de cronometragem tende a afetar o tempo de execução, comprometendo a sua estimativa. Nesse contexto, este trabalho investiga a aplicação de métodos baseados em aprendizado de máquina para a avaliação da capacidade de restaurar vagões em oficinas da MRS Logística, e, ainda, comparar com a aplicação da cronoanálise utilizada atualmente pela empresa. Para tal, foram disponibilizados dados de 2019 sobre a manutenção de vagões. Esses dados serviram para a construção dos modelos de predição desta pesquisa. Foram reservados os dados de nove meses para treinamento, de três meses para testes e também realizou-se a validação cruzada utilizando cinco subdivisões. Com o auxílio do planejamento de experimentos e testes estatísticos de Friedman e Nemenyi, foi possível constatar que, os algoritmos de aprendizado de máquina, são capazes de produzir modelos com melhor qualidade quando combinados com a cronoanálise na liberação de vagões restaurados, comprovado pelas métricas denominadas Erro Médio Absoluto e Raiz Quadrada do Erro Médio.Item Aquisição de imagens digitais e identificação dos ovos do mosquito Aedes Aegypti baseado em um modelo de aprendizado profundo.(2019) Garcia, Pedro Saint Clair; Cámara Chávez, Guillermo; Cámara Chávez, Guillermo; Ferreira, Anderson Almeida; Bianchi, Andrea Gomes Campos; Saúde, André VitalO mosquito Aedes aegypti pode transmitir algumas doenças, o que faz o estudo da proliferação deste vetor uma tarefa necessária. Com o uso de armadilhas feitas em laboratório, denominadas ovitrampas, é possível mapear a deposição de ovos numa determinada comunidade. Uma máquina fotográfica acoplada a uma lupa foi utilizada para adquirir imagens contendo os elementos (ovos) a serem contados. Essas imagens foram processadas a partir de um sistema de cores com o objetivo de encontrar a cor negra, que corresponde `a cor dos ovos. A partir dessas imagens já trabalhadas, foi realizado um processo de transferência de aprendizado com uma rede neural convolucional (CNN). A intenção era separar os elementos que realmente eram ovos dos demais. Por meio desse método, foi possível identificar cada ovo como um simples objeto. Em 90% das imagens testadas a contagem realizada pelo modelo em relação ao número real de ovos foi considerada de correlação perfeita. Para as demais 10% das imagens de teste, a contagem foi considerada de forte correlação, isso aconteceu em imagens que continham uma alta densidade de ovos ou que continham elementos negros que se pareciam com ovos do mosquito.Item Classificação automática de arritmias utilizando mapeamento de sinais de ECG em grafos e redes neurais convolucionais de grafos.(2023) Oliveira, Rafael Francisco de; Luz, Eduardo José da Silva; Freitas, Vander Luis de Souza; Luz, Eduardo José da Silva; Freitas, Vander Luis de Souza; Bianchi, Andrea Gomes Campos; Gertrudes, Jadson Castro; Quiles, Marcos GonçalvesConforme a Organização Mundial da Saúde (OMS), as doenças cardíacas figuram como a principal causa de morte em âmbito global. Embora muitas dessas condições possam ser diagnosticadas antecipadamente, a incidência de casos segue em ascensão. Estimativas indi- cam que mais de 75% dos casos ocorrem em países de baixa renda ou em desenvolvimento, e 17,9 milhões de pessoas morreram de doenças cardíacas apenas em 2019, totalizando 32% das mortes globais. A persistência desse aumento de casos realça a necessidade de novas abordagens que automatizem a detecção de arritmias em sinais de eletrocardiograma (ECG). Na literatura, inúmeras técnicas de extração de características são utilizadas para representar o ECG como séries temporais unidimensionais, com o intuito de classificar pa- drões associados à arritmias. Notavelmente, abordagens baseadas em aprendizado profundo (redes de convolução) têm obtido resultados impressionantes para tal tarefa. Entretanto, abordagens baseadas em grafos e redes complexas foram recentemente investigadas como alternativas para aprimorar o desempenho na detecção de arritmias, porém, ainda se apresenta como um desafio mapear ou representar adequadamente sinais de ECG na forma de grafos. Assim, este estudo explora a representação dos sinais de ECG em grafos por meio do Visibility Graph (VG) e Vector Visibility Graph (VVG). Adicionalmente, utilizamos a estrutura de grafo para a classificação de arritmias com Redes Neurais Convolucionais de Grafos (Graph Convolutional Networks - GCNs). Experimentos envolvendo diferen- tes arquiteturas de GCNs foram avaliados no conjunto de dados MIT-BIH, seguindo os paradigmas inter-patient e intra-patient. Os resultados indicam que a representação dos sinais de ECG por meio de VG e VVG é promissora, e que o VG provou ser mais eficiente em comparação ao método VVG para as arquiteturas de GCNs exploradas. Em relação à classe de batimentos ectópicos supraventriculares (S), os resultados evidenciam que no paradigma inter-patient ainda há um grande desafio a ser superado. Arquiteturas mais simples de GCNs tiveram melhores resultados do que as complexas, indicando que sua simplicidade melhora a captura das características essenciais dos dados e evita ruídos. Essas arquiteturas também são mais eficientes computacionalmente, o que é importante em cenários de recursos limitados.Item Desenvolvimento de dispositivos vestíveis de realidade aumentada de baixocusto para indústria 4.0.(2018) D’Angelo, Thiago; Oliveira, Ricardo Augusto Rabelo; Oliveira, Ricardo Augusto Rabelo; Bianchi, Andrea Gomes Campos; Silva, Jorge Sá; Kelner, Judith; Ferreira, Anderson AlmeidaCom a 4ª Revolução Industrial, as indústrias geram cada vez mais dados que precisam ser processados, visualizados e interpretados de forma rápida e eficiente para aprimorar o processo de tomada de decisões. Nesse cenário, dispositivos vestíveis de realidade aumentada (RA) e realidade virtual (RV) se apresentam como interfaces intuitivas e eficazes para visualização das informações e podem contribuir para o aprimoramento do processo de tomada de decisões em todos os níveis da indústria. Os Head-Mounted Displays (HMDs) são os principais dispositivos vestíveis utilizados em aplicações de RA e RV. Essas tecnologias são consideradas bastante promissoras e tendem a representar um grande mercado num futuro próximo. Elas podem ser aproveitadas tanto para as tarefas relacionadas ao ambiente de trabalho, como para muitas outras atividades diárias, incluindo entretenimento, Diversos HMDs, capazes de fornecer RV e Ra para os usuários, começaram a surgir nos últimos anos. Apesar disso, dois grandes problemas estão dificultando a adoção desses dispositivos em larga escala: os custos extremamente altos (variando de US$ 700 a US$ 5000) e os problemas de experiência de usuário (por exemplo: o conflito entre vergência e acomodação, o campo de visão reduzido, a alta latência na renderização das imagens virtuais e a dificuldade de calibração dos HMDs). Sendo assim, a análise de alternativas de desenvolvimento que impliquem numa redução significativa do custo de construção dos HMDs, sem uma grande deterioração da experiência do usuário, é um importante passo rumo a adoção em larga escala desses dispositivos, facilitando a aplicação industrial e aprimorando a tomada de decisão em todos níveis da indústria. Dessa forma, com intuito de explorar essas questões e de minimizar esses problemas, é proposto, neste trabalho, o desenvolvimento e a avaliação de três protótipos de HMDs de RA construídos com materiais de baixo-custo. O primeiro protótipo contém diversos sensores para coleta de dados sobre o ambiente no qual o usuário está inserido e é capaz de apresentar essas informações através de um display de RA. O segundo protótipo desenvolvido é capaz de executar algoritmos de Gaze Tracking com objetivo de melhorar a interação e a experiência do usuário durante sua utilização. O terceiro protótipo foi desenvolvido através de uma abordagem mais simples e com foco na melhora da usabilidade. Isso possibilitou a realização de experiência de usuário que comprovou a boa relação de custo x benefício desse dispositivo. Dois algoritmos de processamento de imagens e reconhecimento de padrões, relacionados a algumas aplicações de HMDs, foram implementados e avaliados, quanto ao desempenho em tempo real, em diversas plataformas de hardware. Além disso, o uso dos três protótipos é avaliado em um estudo de caso que contempla a aplicação de realidade aumentada vestível na teleinspeção dos transportadores de correia da indústria de mineração.Item Detecção de solos contaminados : uma proposta utilizando aprendizado de máquina em imagens hiperespectrais.(2021) Duarte, Fernando Henrique Oliveira; Pessin, Gustavo; Pabón, Rosa Elvira Correa; Pessin, Gustavo; Pabón, Rosa Elvira Correa; Bianchi, Andrea Gomes Campos; Souza, Jefferson Rodrigo deSensoriamento remoto em locais onde podem ocorrer contaminação de solo por meio de óleos brutos, podem ganhar um reforço com processos ágeis e não destrutivos de caracterização dos compostos. Há interesse em mapear solos em busca de vazamento de óleo por empresas que querem minimizar a perda de matéria-prima e a contaminação do meio ambiente. A identificação da composição de contaminantes e solos ´e comumente realizada por métodos tradicionais em laboratório, tais métodos são precisos, invasivos e demandam de conhecimento t´técnico e equipamentos para análise. Métodos que utilizam imagens espectrais são não invasivos, rápidos e podem ser realizados em campo ou laboratório. O objetivo deste estudo é desenvolver uma abordagem de teste de solo econômica, rápida, não invasiva e autônoma, utilizando dados coletados através da espectroscopia de ondas infravermelhas que alimenta nossos modelos Machine Learning na identificação de solos crus e contaminados por óleos (petróleo bruto) identificando o solo, o contaminante e a concentração. A biblioteca de dados hiper espectral alimenta o desenvolvimento de um algoritmo de aprendizagem de máquina, a fim de classificar solos, óleos e suas concentrações. Assim, automatizando o mapeamento de infiltrações e vazamentos em terra. Propomos três fluxos de aprendizado com modelos Random Forest que apresentam resultados com acurácia acima de 90%. Os testes foram realizados utilizando três diferentes tipos de dados, que indicam o maior benefício de desempenho quando utiliza-se os dados filtrados com o método contínuo removido (espectro normalizado) na identificação de solos e contaminantes. Na identificação da concentração os dados filtrados pela média apresentaram melhor resultado. Os resultados dos testes do fluxo de aprendizado dependente, indicam taxa de acerto média de 98% na classificação dos solos, 94% na classificação dos contaminantes e 93% na classificação das concentrações. Outras métricas como F1-Score, Revocação e Precisão apresentam resultados específicos de cada rótulo, evidenciando o desempenho dos classificadores ao identificá-los. O desempenho dos fluxos de aprendizado manifestara resultados constantes, com baixa variância e dispersão, e taxas de acerto acima de 93% no geral. Os resultados apresentados, sugerem que a tecnologia tem grande potencial de uso no monitoramento ambiental de solos, ao longo de dutos e refinarias a procura de vazamentos.Item Extração e análise de características da linguagem para identificação de evidências da patologia dislexia.(2018) Ribeiro, Fernanda Maria; Bianchi, Andrea Gomes Campos; Pereira Junior, Álvaro Rodrigues; Bianchi, Andrea Gomes Campos; Pereira Junior, Álvaro Rodrigues; Ferreira, Anderson Almeida; Barbosa, Adriano Vilela; Alves, Luciana MendonçaAs patologias da linguagem são alterações na leitura de um texto, ocasionadas por traumatismos físicos ou genéticos. Devido a falta de ferramentas específicas e ao alto custo de uso do software proprietário, de tecnologias de processamento de sinais de áudio para ajudar no processo de identificação de patologias genéticas, muitas pessoas ficam sem tratamento, e, às vezes, à margem da sociedade. Foi desenvolvido uma metodologia por especialistas, que extrai características da leitura de um texto em voz alta e retorna a hipótese de diagnóstico. Neste trabalho, descreve-se uma nova abordagem computacional com o intuito de automatizar de forma eficiente a indicação de probabilidade da dislexia. A análise é feita em gravações (sinais de áudio) da leitura de textos pré-definidos com crianças em idade escolar. São extraídas características diretas e indiretas do sinal de áudio. As diretas são extraídas por meio da metodologia de separação de pausas e sílabas, enquanto as características indiretas são extraídas através da metodologia de alinhamento de sinais de áudio, Hidden Markov Model e pelo desenvolvimento de algumas heurísticas de melhoria. Após a obtenção das características realiza-se a indicação da probabilidade da dislexia por meio de duas metodologias de classificação, a primeira análoga a de especialistas humanos, baseada em pesos; e a segunda por meio de dois classificadores conhecidos na literatura, KNN e SVM. Os testes foram realizados sobre uma base de dados de 40 áudios, 30 sem dislexia e 10 com dislexia, contendo a gravação da leitura de um texto padrão por crianças, sendo comparados a classificação realizada pelo especialista, do texto completo, obtendo 100% de acurácia sobre a indicação de probabilidade de dislexia, sobre os três métodos. A diferença entre os valores das características obtidas automaticamente e os valores de teste foi abaixo de 20% para a maioria das características. Finalmente, os resultados apresentados nesta dissertação mostram que existe um campo de atuação muito promissor do processamento de sinais de áudio, no que diz respeito ao auxílio a especialistas na tomada de decisão relacionadas a patologias da linguagem.Item Extração e comparação de características locais para o reconhecimento facial por meio de retratos falados.(2014) Silva, Marco Antonio de Albuquerque; Cámara Chávez, Guillermo; Cámara Chávez, Guillermo; Gomes, David Menotti; Bianchi, Andrea Gomes Campos; Nascimento, Erickson Rangel doSistemas de reconhecimento facial através de retratos falados são muito importantes para agências de segurança. Esses sistemas podem ajudar a localizar ou diminuir o número de potenciais suspeitos. Recentemente, vários métodos foram propostos para resolver esse problema, mas não há uma comparação clara de desempenho entre eles. Neste trabalho é proposta uma nova abordagem para o reconhecimento facial através de fotografias/retratos falados baseada no Local Feature-based Discriminant Analysis (LFDA). Esse novo método foi testado e comparado com seus antecessores, utilizando três diferentes conjuntos de imagens (retratos falados) e também com a adição de uma galeria extra de 10.000 fotografias para estender a galeria. Experimentos utilizando as bases de imagens CUFS e CUFSF mostraram que a nossa abordagem supera as abordagens do estado-da-arte, além de ser 43% mais rápido que o segundo método, o LFDA. Nossa abordagem também mostra bons resultados com forensic sketches. A limitação ao avaliar este conjunto de imagens está no seu tamanho muito pequeno. Ao aumentar o conjunto de dados de treinamento, a precisão da nossa abordagem vai aumentar, uma vez que foi demonstrado por nossos experimentos. Além disso, demonstramos o desempenho e comparamos vários descritores e os principais métodos, utilizando três bases de dados diferentes e uma galeria extra, tal comparação não existia na literatura.Item Fusão de características na re-identificação de pessoas.(2018) Sales, Anderson Luís Cavalcanti; Cámara Chávez, Guillermo; Cámara Chávez, Guillermo; Ferreira, Anderson Almeida; Bianchi, Andrea Gomes Campos; Schwartz, William RobsonRe-Identi cação de pessoas é um problema de correspondência entre identidades capturadas por câmeras de vigilância não sobrepostas. Essa correspondência, também conhecida como rastreamento multi-câmeras é uma tarefa da área de visão computacional. Tem grande foco por se tratar, principalmente, de demandas nas esferas de segurança pública e/ou pessoal. Esse foco se dá em vista das possíveis incapacidades humanas na realização de tarefas repetitivas por um tempo prolongado, por exemplo. Intenciona-se com essa abordagem suavizar, quão possível, os custos inerentes ao processo computacional tradicional. A abordagem proposta é fracionada em duas partes: aprendizado de um espaço métrico de baixa dimensionalidade (denominado fase inicial) e reorganização de rank de amostras a partir de uma classi cação binária ponderada, a m de reduzir a incompatibilidade entre várias câmeras. Usa-se handcrafted image descriptors como ferramentas. Adicionalmente, emprega-se na abordagem proposta, um modelo de aprendizado métrico discriminante para representar features em uma nova dimensão; aprendizado métrico de similaridade em larga escala e distância métrica para construção dos ranks primários entre amostras de teste e imagens da galeria. Em todo o trabalho as imagens amostrais foram divididas a partir da imagem original em secções, a m de aumentar a discriminação entre as amostras.Item Jogos sérios como estratégia de apoio ao ensino e aprendizagem de música : aplicação do jogo Musicália na educação infantil.(2023) Lima, Wemerson Geisler de; Freitas, Alan Robert Resende de; Freitas, Alan Robert Resende de; Bianchi, Andrea Gomes Campos; Silva, Saul Emanuel Delabrida; Darin, Ticianne de Gois RibeiroO presente estudo tem como objetivo analisar a possibilidade de aplicação do jogo Musicália no processo de ensino e aprendizagem de música para crianças pequenas da Educação Infantil com base nos campos de experiência da BNCC e seus objetivos de aprendizagem e desenvolvimento. Foi realizada uma análise comparativa do jogo Musicália com os objetivos de aprendizagem e desenvolvimento dos campos de experiências para crianças pequenas da BNCC, com vistas ao desenvolvimento de uma visão crítica sobre a possibilidade de sua aplicação para o processo de ensino e aprendizagem de música por crianças da pré-escola (4 a 5 anos e 11 meses). Trata-se de uma pesquisa exploratória de abordagem qualitativa, com os resultados a serem analisados com base em uma análise de conteúdo. Foram avaliadas variáveis como usabilidade, leiturabilidade, topografia, uso de mídias, imagens e figuras e sua adequação à idade das crianças e às propostas da BNCC. Os resultados verificados nesta pesquisa demons- traram que o Musicália apresenta importantes características para ser aplicado em sala de aula no processo de ensino e aprendizagem de música para crianças da educação infantil a partir de 1 ano e 7 meses, sendo capaz de inserir a música no cotidiano dessas crianças. Todavia, ainda demanda ajustes para que fique de acordo com a BNCC e, assim, possa atingir os objetivos previstos na mesma.Item Logo detection with second judge single shot multibox.(2017) Coelho, Leonardo Bombonato Simões; Cámara Chávez, Guillermo; Bianchi, Andrea Gomes Campos; Cámara Chávez, Guillermo; Ferreira, Anderson Almeida; Bianchi, Andrea Gomes Campos; Schwartz, William RobsonWith the increasing popularity of Social Networks, the way people interact has changed and the huge amount of data generated open doors to new strategies and marketing analysis. According to Instagram 1 and Tumblr2 an average of 95 and 35 million photos, respectively, are published every day. These pictures contain several implicit or explicit brand logos, this allows us to research how can a brand be better widespread based in regional, temporal and cultural criteria. Using advanced computer vision techniques for object detection and recognition, we can extract information from these images, making possible to understand the impact and the comprehensiveness of a specific brand. This thesis proposes a logo detection technique based on a Convolutional Neural Network (CNN), also used as a second judge. Our proposal is built on the Single Shot Multibox (SSD). In our research, we explored several approaches of the second judge and managed to reduce significantly the number of false positives in comparison with the original approach. Our research outperformed all the others researches on two different datasets: FlickrLogos-32 and Logos-32plus. On the FlickrLogos-32, we surpass the actual state-of-the-art method by 5.2% of F-score and for the Logos-32Plus by 3.0% of F-score.Item Melhorias no processo de blocagem para resolução de entidades baseadas na relevância dos termos.(2018) Caldeira, Laís Soares; Ferreira, Anderson Almeida; Bianchi, Andrea Gomes Campos; Bianco, Guilherme Dal; Ferreira, Anderson AlmeidaA extensa variedade de informações disponíveis na Web motivou o desenvolvimento de aplicações que integram dados heterogêneos vindos de diferentes fontes. A integração de dados tem como objetivo facilitar o acesso a informações fornecendo uma visão unificada dos dados. Uma tarefa importante no processo de integração de dados é a Resolução de Entidades, que visa identificar instâncias que se referem ao mesmo objeto do mundo real. Uma simples tarefa de Resolução de Entidades pode ser realizada comparando cada instância de uma coleção de dados com todas as outras, o que seria uma tarefa muito custosa para grandes coleções de dados. Nesse contexto, técnicas de blocagem são utilizadas para reduzir o número de comparações criando blocos que contêm as instâncias propensas a corresponder à mesma entidade no mundo real, de modo que a tarefa de Resolução de Entidades possa ser aplicada apenas a esses blocos. Técnicas de processamento de blocos aumentam ainda mais a eficiência, descartando comparações ou mesmo blocos inteiros que envolvam instâncias não correspondentes. Neste trabalho, é proposta uma forma de escolher termos para serem usados na etapa de blocagem e na etapa de processamento de blocos, baseado na relevância dos termos na coleção de dados, de modo a construir blocos que possibilitem encontrar o maior número de instâncias correspondentes, minimizando a quantidade de comparações desnecessárias. A proposta é avaliada comparando-a com trabalhos relevantes disponíveis na literatura. Os resultados mostram que a proposta reduz o tempo de processamento pela metade e melhora a qualidade dos blocos gerados, escalando eficientemente grandes coleções de dados altamente heterogêneos.Item Um método de desambiguação de sentido e substituição lexical apoiado em dicionários e embeddings.(2020) Januario, Isaias Frederick; Pereira Junior, Álvaro Rodrigues; Pereira Junior, Álvaro Rodrigues; Bianchi, Andrea Gomes Campos; Lopes, LuceleneA substituição lexical permeia diferentes atividades inerentes às áreas do Processamento de Linguagem Natural, como a simplificação de texto e expansão de consultas. A substituição tem sido explorada amplamente na literatura apresentando frequente evolução, principalmente quanto às fontes de dados utilizadas para a geração de potenciais substitutos que alimentam o processo. Naturalmente, dicionários têm sido constantemente usados por agruparem conjuntos de sinônimos em sua estrutura. Entretanto, o caráter polissêmico das palavras inviabiliza a troca direta de uma determinada palavra por qualquer sinônimo a ela associado no dicionário, já que a troca requer a análise completa do contexto. Em outro nicho de fontes, os modelos de espaço vetorial, tais como os embeddings, são utilizados para representar os termos a partir de seus contextos de aplicação. Em contrapartida, representar as palavras considerando fatores meramente contextuais, em muitos casos, dá margem para uma aproximação de termos no espaço mesmo não sendo sinônimos. Portanto, as deficiências mencionadas sugerem a junção de bases anotadas e embeddings como alternativa promissora para ganhos de resultados na tarefa de substituição. Assim, apresentamos um método de substituição utilizando informações contidas em dicionários combinados − como as relações linguísticas estruturadas em taxonomias − para coleta de potenciais sinônimos. Nosso método mensura a preservação do significado da sentença modificada focando um escopo restrito da sentença original. Consideramos também o contexto completo para apoiar o processo de desambiguação extraindo aspectos como coocorrência de termos para alimentar operações vetoriais nos modelos com a intenção de destacar os melhores sinônimos em um conjunto previamente selecionado. Nosso método superou uma ampla gama de trabalhos conhecidos na literatura na predição do melhor substituto de palavras contidas em frases de uma consolidada base de experimentação.Item Um método de determinação de origem-destino e contagem de veículos em ambiente urbano.(2015) Mendes, Jean Carlo; Pereira Junior, Álvaro Rodrigues; Bianchi, Andrea Gomes Campos; Mercshmann, Luiz Henrique de Campos; Medeiros, Fátima Nelsizeuma Sombra deA quantidade de veículos que transitam pelas vias urbanas têm crescido constantemente fazendo com que o controle de tráfego se torne uma tarefa cada vez mais complicada. Os órgãos governamentais se vêem obrigados a adotar políticas de controle mais rígidas como, por exemplo, a implantação de sistemas de rodízio onde somente os veículos que se enquadram em categorias pre-estabelecidas podem trafegar em determinados dias e horários. A determinação de quais vias necessitam de intervenção pode ser uma tarefa bastante difícil e demorada quando feita de forma manual, já que a quantidade de vias e de veículos presentes em uma cidade é grande. Considerando este cenário, técnicas automatizadas de determinação de origem-destino e contagem de veículos podem ser de grande auxílio para o controle de tráfego urbano. Este trabalho propõe uma melhoria nos algoritmos de determinação de origem-destino de veículos tradicionais através da construção de técnicas que minimizam a ocorrência de erros de segmentação e rastreio de objetos. A performance do framework construído foi avaliada através do uso de duas bases de dados de vídeo, sendo uma delas de domínio público e outra obtida através de uma câmera de controle de tráfego instalada em um cruzamento de uma capital brasileira. Os resultados obtidos com as melhorias desenvolvidas apresentaram um ganho em relação aos resultados obtidos com o uso do algoritmo tradicional usado como baseline.Item Proposta e avaliação de um sistema automático para identificação de veículos.(2013) Oliveira Neto, Vantuil José de; Menotti, David; Menotti, David; Cámara Chávez, Guillermo; Bianchi, Andrea Gomes Campos; Facon, Jacques; Guimarães, Silvio Jamil Ferzoli; Santos, Haroldo GambiniSistemas automáticos de identificação de veículos têm como objetivo a identificação de automóveis por meio de suas placas. A maioria dos trabalhos relatados na literatura científica utilizam imagens únicas de um veículo, em geral capturadas sob condições de iluminação e distância controladas, utilizando em muitos casos um gatilho que informa ao sistema qual o momento em que a imagem deve ser processada pelo sistema. Nosso sistema parte de uma abordagem diferente: a localização e o rastreamento dos veículos ao longo da cena. Com esta abordagem o uso do gatilho é dispensado, a área para localização da placa é diminuída devido ao rastreamento do veículo e a quantidade de quadros disponíveis para um mesmo veículo é aumentada. Construímos uma base de vídeos com 1061 veículos divididos em 23 vídeos diferentes, capturados em quatro pontos distintos no acesso principal da nossa universidade. O sistema foi desenvolvido utilizando C++ e OpenCv, e constituído de 6 módulos: localização de movimento, rastreamento de veículos, seleção do melhor frame, localização da placa, segmentação dos caracteres e reconhecimento; cada um dos módulos foi construído independentemente, permitindo assim que trabalhos futuros alterem apenas um destes módulos, dando mais flexibilidade a trabalhos futuros. O sistema funciona em tempo real, processando o vídeo em menos tempo do que o tempo total do vídeo. Em nossa base, o sistema foi capaz de identificar perfeitamente apenas 27,7% dos veículos, no entanto de reconhecer 54,7% dos caracteres rotulados. Em pontos de referência mais adequados, atingimos 65,8% e 65,03% de reconhecimento de caracteres, com 71,11% e 70,30% de identificação de veículos com quatro ou mais dígitos da placa corretamente reconhecidos. Embora o sistema não apresente resultados promissores nos vídeos avaliados, ele abre espaço para que diferentes métodos e abordagens encapsulados em módulos do sistema possam ser facilmente avaliados.Item Reconhecimento de caracteres em imagens com ruído usando Deep Learning.(2017) Peixoto, Sirlene Pio Gomes da Silva; Gomes, David Menotti; Gomes, David Menotti; Bianchi, Andrea Gomes Campos; Cámara Chávez, Guillermo; Todt, Eduardo; Ferreira, Anderson AlmeidaDevido à degradação e baixa qualidade em imagens com ruído, como imagens de cenas naturais e CAPTCHAs (Completely Automated Public Turing test to tell Computers and Humans Apart) baseados em texto, o problema de reconhecimento de caracteres continua a ser extremamente desafiador. Neste trabalho, estudamos três abordagens diferentes de redes convolucionais (otimização de arquitetura com filtros aleatórios, aprendizado de filtros não supervisionado e supervisionado) que visam melhorar as representações de característica dessas imagens por meio de deep learning. Nós realizamos experimentos no amplamente utilizado dataset The Street View House Numbers (SVHN), em um novo dataset de CAPTCHAS criado por nós, e em um dataset de placas brasileiras. A abordagem que aprende os pesos dos filtros por meio do algoritmo back-propagation utilizando a técnica data augmentation e a estratégia de agregação de algumas camadas localmente conectadas à rede convolucional obteve resultados promissores para o dataset CAPTCHA (97,36% de acurácia para caracteres e 85,4% para CAPTCHAs) e resultados muito próximos ao estado da arte em relação ao dataset SVHN (97,45 % de acurácia para dígitos). Já no dataset de placas brasileiras, que contém um número de amostras muito inferior aos demais, a abordagem que realiza a otimização de arquitetura com filtros aleatórios obteve os resultados mais promissores. Além disso, analisamos o comportamento da abordagem deep learning que realiza o aprendizado supervisionado de filtros diante da exposição do dataset SVHN a interferências adversas.Item Rede de convolução para sistema biométrico baseado em EEG.(2018) Schons, Thiago; Moreira, Gladston Juliano Prates; Moreira, Gladston Juliano Prates; Bianchi, Andrea Gomes Campos; Gomes, David Menotti; Coelho, Vitor NazárioSistemas biométricos encontram-se em grande expansão pela necessidade de segurança em todas as esferas da sociedade, nesse contexto sistemas baseados em eletroencefalograma (EEG) vem despertando grande interesse entre os pesquisadores. No entanto, essa modalidade biométrica é suscetível a ruídos na captação de sinais e tem problemas de escala, acurácia e captação em ambientes não controlados, representando um grande desafio. Métodos baseados em redes neurais de convolução vêm sendo explorados na literatura para processamento de sinais e resultados expressivos para sua classificação vem sendo obtidos. Nesse cenário, o método proposto neste trabalho é baseado em Rede Neural de Convolução (CNN) para verificação biométrica e avaliação em uma base de dados da Physionet. Uma técnica de data augmentation baseada em sobreposição dos sinais é proposta para ampliar a quantidade de dados de treinamento da rede de aprendizagem em profundidade. A redução do equal error rate (EER) de 4,5% para 0,19% nos testes baseline em comparação com a literatura mostram que o método é um caminho promissor na representação de sinais cerebrais para biometria.Item Segmentação de núcleos de células cervicais em exame de Papanicolau.(2018) Oliveira, Paulo Henrique Calaes; Bianchi, Andrea Gomes Campos; Bianchi, Andrea Gomes Campos; Moreira, Gladston Juliano Prates; Ushizima, Daniela Mayumi; Medeiros, Fátima Nelsizeuma Sombra deA utilização de algoritmos que possam auxiliar no diagnostico do exame de Papanicolau vem sendo estudada ao longo das ultimas décadas devido ao aumento dos casos de Câncer cervical na população e respectivos dados coletados. Uma das etapas dessa automatização do diagnóstico é a segmentação automática das imagens. Alguns dos maiores problemas quando se realiza a segmentação deste tipo de imagens são a sobreposição celular, o dobramento das células e os artefatos que se confundem aos núcleos. Então é apresentada uma nova abordagem de segmentação nuclear utilizando uma heurística associada a um algoritmo genético multi-objetivo. O processo envolve três etapas principais, que são o pré-processamento, a calibração da heurística e a segmentação dos núcleos. Experimentos realizados com bases de dados sintéticas disponibilizadas no Overlapping Cervical Cytology Image Segmentation Challenge - ISBI2014 e uma nova base de imagens reais sugerem uma melhoria na detecção dos núcleos em comparação com os resultados obtidos pelos vencedores do desafio. Desse modo, esse trabalho apresenta uma interface web colaborativa criada para a geração de uma base de dados com imagens reais e um método para segmentação de núcleos que utiliza uma heurística associada a um algoritmo evolutivo multi-objetivo.Item Segmentação de núcleos em células cervicais obtidas em exames de Papanicolaou.(2019) Diniz, Débora Nasser; Souza, Marcone Jamilson Freitas; Bianchi, Andrea Gomes Campos; Souza, Marcone Jamilson Freitas; Bianchi, Andrea Gomes Campos; Medeiros, Fátima Nelsizeuma Sombra de; Penna, Puca Huachi VazEste trabalho tem seu foco na detecção de núcleos em imagens sintéticas de células cervicais. Este é um passo importante na construção de uma ferramenta computacional para ajudar os citopatologistas a identificarem alterações celulares a partir de exames de Papanicolaou. Para detectar esses núcleos propomos duas abordagens, a primeira baseada em Iterated Local Search (ILS) e a segunda em Árvore de Decisão (DT). O objetivo é melhorar a assertividade do exame e reduzir a carga de trabalho do profissional. As duas abordagens utilizam características de uma região da imagem para identificar um núcleo. Para ambas, foi necessário fazer um pré-processamento das imagens para dividí-las em regiões a serem analisadas. Para isto, foram utilizados os algoritmos Simple Linear Iterative Clustering (SLIC) e Density Based Spatial Clustering of Applications with Noise (DBSCAN). No ILS, foi feita uma investigação para saber quais dessas características são relevantes para a identificação dos núcleos. O pacote irace foi utilizado para fazer a calibração automática dos parâmetros do ILS. Já para a DT proposta, foi construída uma base de dados com todas as características extraídas das regiões e feita uma seleção das mais importantes por meio de uma matriz de correlação. Com essas características selecionadas foi feito o treinamento. Por fim, as abordagens propostas foram comparadas entre si e com outros métodos da literatura segundo as métricas revocação, precisão e F1, usando-se o banco de dados ISBI Overlapping Cytology Image Segmentation Challenge (2014). Os resultados obtidos mostraram a superioridade da abordagem via DT sobre o ILS em todas as métricas, assim como sua superioridade sobre todos os outros métodos da literatura com relação às métricas F1 e revocação.Item Um sistema embarcado de detecção de fadiga e distração de motoristas.(2020) Santos, Ricardo Creonte Câmara de Meira; Oliveira, Ricardo Augusto Rabelo; Oliveira, Ricardo Augusto Rabelo; Bianchi, Andrea Gomes Campos; Correia, Luiz Henrique Andrade; Silva, Jorge Miguel SáEstudos mostram que grande parte dos acidentes nas estradas são causados por falhas humanas, dentre estas falhas estão fadiga e distração dos condutores de veículos. Neste trabalho é apresentado uma proposta de sistema de detecção de fadiga e desatenção de condutores baseado em visão computacional, visando o aumento da segurança no ambiente veicular. Este sistema realiza uma análise na imagem da face do motorista. Através desta análise facial o sistema é capaz de detectar distrações e fadiga dos condutores. A detecção de distrações é realizada através da orientação (posição) da face e a fadiga é detectada através da medição da duração das piscadas e bocejos. Para a análise de piscadas é utilizada a medida PERCLOS (Percentage of Eyelid Closure). Ao detectar uma situação de risco o sistema alerta os condutores para evitar a ocorrência de acidentes. Neste trabalho é mostrada uma comparação de diferentes plataformas de desenvolvimento embarcado ao executar algoritmos de detecção e classificação de face e olhos. Esta comparação serviu para escolha do hardware utilizado no sistema embarcado. Após a escolha do hardware é apresentado a proposta de sistema e sua validação. Os testes de validação foram realizados em ambiente real com motoristas profissionais, livrando os testes de viés laboratoriais e mostrando a eficácia do sistema na detecção de situações de risco. Por fim, é apresentado como os alertas de áudio emitidos pelo sistema influenciam de maneira positiva o comportamento dos motoristas. Para isso, é comparado a diferença no comportamento dos motoristas quando o sistema está gerando os alertas de áudio e quando os alertas estão desabilitados. Os testes mostraram que ao utilizar os alertas de áudio os motoristas tendem a gerar uma quantidade menor de situações de risco.Item Strong e Herde : jogos em 2D e 3D com características para estimular o processo cognitivo das crianças com autismo.(2022) Honorato, Noemi da Silva; Silva, Saul Emanuel Delabrida; Silva, Saul Emanuel Delabrida; Bianchi, Andrea Gomes Campos; Darin, Ticianne de Gois Ribeiro; Santos, Wilk Oliveira dosO autismo é uma síndrome cujas causas não são completamente conhecidas. É caracterizada por limitação na comunicação e socialização, atraso significativo de linguagem e deficiência intelectual. Tais limitações tem feito com que ao longo dos últimos anos, diferentes estratégias tenham sido analisadas para diminuir os aspectos negativos da síndrome. Dentre as estratégias adotadas, os jogos educativos tem ganhado destaque. Assim, no intuito de contribuir com o desenvolvimento cognitivo e aprendizagem de crianças autistas, foram desenvolvidos dois jogos, um em 2D e o outro em 3D. Além de um mapeamento sistemático, para identificar os critérios usados na elaboração de jogos sérios para autistas. Neste contexto, os jogos educativos, podem ajudar as crianças autistas, auxiliar os familiares e professores na aplicação do conteúdo pedagógico nas aulas remotas. Dessa forma, o jogo Strong é voltado a comunicação e socialização. Apresenta o ensino das cores, expressões faciais, atividades da vida diária, números, palavras e formas geométricas. O Herde é um jogo ambiental baseado em ciência cidadã, que visa facilitar a compreensão, o aprendizado e a preservação do meio ambiente. O jogo desenvolvido apresenta além de cenário e personagem, questionários de prova para fixação de conteúdo disciplinar. Os resultados esperados indicam que os jogos podem auxiliar os educadores contribuindo com i) o desenvolvimento das funções conativas, ii) funções executivas superiores, e iii) funções cognitivas das crianças.