Análise de combinação de classificadores usando uma abordagem multiobjetivo baseada em acurácia e número de classificadores.
Nenhuma Miniatura Disponível
Data
2013
Título da Revista
ISSN da Revista
Título de Volume
Editor
Programa de Pós-Graduação em Ciência da Computação. Departamento de Ciência da Computação, Instituto de Ciências Exatas e Biológicas, Universidade Federal de Ouro Preto.
Resumo
O Sensoriamento Remoto é uma forma de obter informações sobre a Terra a partir do espaço, com a finalidade de melhorar a gestão dos recursos naturais, o uso da terra e a proteção do meio ambiente. Esse campo do conhecimento tem se beneficiado dos diversos avanços tecnológicos dentre os quais pode ser citada a imagem hiperespectral. Este tipo de imagem pode ser composto por centenas de bandas, cada uma delas correspondendo a uma determinada faixa do espectro eletromagnético. Pode-se perceber a riqueza de informação que tal imagem pode fornecer, conduzindo a uma análise mais precisa. No entanto, para tratar esse volume de informações, tanto em qualidade quanto em quantidade, é necessária a utilização de algoritmos e métodos que consigam tirar proveito de toda a informação fornecida. Uma tarefa comum na análise desses dados é a geração de mapas temáticos a partir da classificação da cobertura terrestre. Tradicionalmente, procura-se desenvolver diferentes algoritmos de classificação e depois aquele que apresenta o melhor desempenho, ou seja maior acurácia, é escolhido. Este tipo de metodologia pode acarretar em perdas de importantes informações contidas nos classificadores descartados. Uma forma de se evitar isso, que tem sido bastante estudada e utilizada atualmente, é a combinação de múltiplas abordagens de classificação e a consequente produção de mapas temáticos mais precisos. No presente trabalho, é feita a combinação de doze abordagens de classificação, obtidas usando três representações de dados e quatro algoritmos de aprendizagem diferentes. As representações de dados usadas são a Pixelwise, Extended Morphological Profiles (EMP) e Feature Extraction by Genetic Algorithms (FEGA), que foram classificadas com os algoritmos de aprendizagem Support Vector Machines (SVM) com kernel Radial Basis Function (RBF) e kernel Linear, K-Nearest Neighbor (KNN) e Multilayer Perceptron Neural Network (MLP). O método de combinação proposto é baseado em uma combinação linear ponderada, em que um Programa Linear Inteiro (PLI) encontra os pesos para cada abordagem de classificação utilizada e é denominado Weighted Linear Combination optimized by Integer Linear Programming (WLC-ILP). Para analisar os resultados obtidos, o método proposto foi comparado a outros métodos de combinação como o Weighted Linear Combination optimized by Genetic Algorithm (WLC-GA) e, os tradicionais, como Majority Vote (MV) e Average Rule. O (WLC-ILP) superou os resultados dos métodos (MV) e Average Rule e obteve resultados similares ao (WLC-GA), porém, dez vezes mais rápido que este. Uma questão ainda em aberto está relacionada a quantos e quais classificadores de um conjunto utilizar, de forma a obter uma acurácia mais precisa. Não se sabe ao certo o que faz uma combinação produzir resultados, ainda que não seja sempre garantido, melhores do que um único classificador. Alguns autores apontam a diversidade de um conjunto como fator principal de êxito de um combinador, no entanto, não existe uma definição formal, amplamente aceita do que seja diversidade. Uma vez que é desejável produzir melhores acurácias utilizando o menor número de classificadores possível, um Algoritmo Genético Multiobjetivo apresenta-se como meio adequado para realização desta tarefa.
Descrição
Palavras-chave
Sensoriamento remoto, Programação linear, Sistemas de recuperação da informação – códigos numéricos
Citação
TINÔCO, S. L. J. L. Análise de combinação de classificadores usando uma abordagem multiobjetivo baseada em acurácia e número de classificadores. 2013. 115 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Ouro Preto, Ouro Preto, 2013.