Análise de combinação de classificadores usando uma abordagem multiobjetivo baseada em acurácia e número de classificadores.
dc.contributor.advisor | Gomes, David Menotti | pt_BR |
dc.contributor.author | Tinôco, Sandro Luiz Jailson Lopes | |
dc.date.accessioned | 2014-02-13T11:44:20Z | |
dc.date.available | 2014-02-13T11:44:20Z | |
dc.date.issued | 2013 | |
dc.description.abstract | O Sensoriamento Remoto é uma forma de obter informações sobre a Terra a partir do espaço, com a finalidade de melhorar a gestão dos recursos naturais, o uso da terra e a proteção do meio ambiente. Esse campo do conhecimento tem se beneficiado dos diversos avanços tecnológicos dentre os quais pode ser citada a imagem hiperespectral. Este tipo de imagem pode ser composto por centenas de bandas, cada uma delas correspondendo a uma determinada faixa do espectro eletromagnético. Pode-se perceber a riqueza de informação que tal imagem pode fornecer, conduzindo a uma análise mais precisa. No entanto, para tratar esse volume de informações, tanto em qualidade quanto em quantidade, é necessária a utilização de algoritmos e métodos que consigam tirar proveito de toda a informação fornecida. Uma tarefa comum na análise desses dados é a geração de mapas temáticos a partir da classificação da cobertura terrestre. Tradicionalmente, procura-se desenvolver diferentes algoritmos de classificação e depois aquele que apresenta o melhor desempenho, ou seja maior acurácia, é escolhido. Este tipo de metodologia pode acarretar em perdas de importantes informações contidas nos classificadores descartados. Uma forma de se evitar isso, que tem sido bastante estudada e utilizada atualmente, é a combinação de múltiplas abordagens de classificação e a consequente produção de mapas temáticos mais precisos. No presente trabalho, é feita a combinação de doze abordagens de classificação, obtidas usando três representações de dados e quatro algoritmos de aprendizagem diferentes. As representações de dados usadas são a Pixelwise, Extended Morphological Profiles (EMP) e Feature Extraction by Genetic Algorithms (FEGA), que foram classificadas com os algoritmos de aprendizagem Support Vector Machines (SVM) com kernel Radial Basis Function (RBF) e kernel Linear, K-Nearest Neighbor (KNN) e Multilayer Perceptron Neural Network (MLP). O método de combinação proposto é baseado em uma combinação linear ponderada, em que um Programa Linear Inteiro (PLI) encontra os pesos para cada abordagem de classificação utilizada e é denominado Weighted Linear Combination optimized by Integer Linear Programming (WLC-ILP). Para analisar os resultados obtidos, o método proposto foi comparado a outros métodos de combinação como o Weighted Linear Combination optimized by Genetic Algorithm (WLC-GA) e, os tradicionais, como Majority Vote (MV) e Average Rule. O (WLC-ILP) superou os resultados dos métodos (MV) e Average Rule e obteve resultados similares ao (WLC-GA), porém, dez vezes mais rápido que este. Uma questão ainda em aberto está relacionada a quantos e quais classificadores de um conjunto utilizar, de forma a obter uma acurácia mais precisa. Não se sabe ao certo o que faz uma combinação produzir resultados, ainda que não seja sempre garantido, melhores do que um único classificador. Alguns autores apontam a diversidade de um conjunto como fator principal de êxito de um combinador, no entanto, não existe uma definição formal, amplamente aceita do que seja diversidade. Uma vez que é desejável produzir melhores acurácias utilizando o menor número de classificadores possível, um Algoritmo Genético Multiobjetivo apresenta-se como meio adequado para realização desta tarefa. | pt_BR |
dc.description.abstracten | The Remote Sensing is a form’s information extraction about the Earth from space, with the aim of improving the management of natural resources, land use and environmental protection. This field of knowledge has benefited from many technological advances among which may be mentioned the hyperspectral image. This type of image can be composed of hundreds of bands, each corresponding to a particular range of the electromagnetic spectrum. One can realize the wealth of information that can provide such an image, leading to a more precise analysis. However, to handle this volume of information, both in quality and quantity, and required the use of algorithms and methods which are able to extract the information provided. A common task in data analysis is the generation of thematic maps from the classification of land cover. Traditionally, we try to develop different ranking algorithms and then the one that has the best performance, i.e., higher accuracy is chosen. This type of methodology may result in loss of important information contained in discarded classifiers. One way to avoid this, which has been widely studied and used today, is the combination of multiple approaches to classification and consequent production of thematic maps more accurate. In this study, the combination is done twelve classification approaches, obtained by using three data representations and four different learning algorithms. Data representations used are Pixelwise, Extended Morphological Profiles (EMP) and Feature Extraction by Genetic Algorithms (FEGA), who were classified with the learning algorithms Support Vector Machines (SVM) with kernel Radial Basis Function (RBF) e kernel Linear, K-Nearest Neighbor (KNN) and Multilayer Perceptron Neural Network (MLP). The method of combination proposed is based on a weighted linear combination, where Linear Programming is the weight for each classification approach is used and referred Weighted Linear Combination optimized by Linear Programming (WLCILP). To analyze the results obtained, the proposed method was compared to other methods such as the combination Weighted Linear Combination optimized by Genetic Algorithm (WLC-GA), and the traditional, as Majority Vote (MV) and Average Rule. The Weighted Linear Combination optimized by Integer Linear Programming (WLCILP) surpassed the results of the methods (MV) and Average Rule and obtained similar results (WLC-GA), however, ten times faster than this. A still open issue is related to how many and which use a set of classifiers in order to obtain a more precise accuracy. No one knows for sure what causes a combination produce results, though not always guaranteed, better than a single classifier. Some authors indicate the diversity of a set as the main factor of success of a combiner, however, there is no formal definition, it is widely accepted that the diversity. Since it is desirable to produce better accuracies using the minimum number of classifiers as possible, an multiobjective genetic algorithm is presented as a means suitable for this task. | |
dc.identifier.citation | TINÔCO, S. L. J. L. Análise de combinação de classificadores usando uma abordagem multiobjetivo baseada em acurácia e número de classificadores. 2013. 115 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Ouro Preto, Ouro Preto, 2013. | pt_BR |
dc.identifier.uri | http://www.repositorio.ufop.br/handle/123456789/3472 | |
dc.language.iso | pt_BR | pt_BR |
dc.publisher | Programa de Pós-Graduação em Ciência da Computação. Departamento de Ciência da Computação, Instituto de Ciências Exatas e Biológicas, Universidade Federal de Ouro Preto. | pt_BR |
dc.rights.license | A concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor com as seguintes condições: Na qualidade de detentor dos direitos autorais, de acordo com a lei nº 9610/98, autorizo a Universidade Federal de Ouro Preto/UFOP a disponibilizar gratuitamente, sem ressarcimento dos direitos autorais, o texto integral da publicação supracitada, em meio eletrônico, na BDTD - Biblioteca Digital de Teses e Dissertações e no Repositório Institucional da UFOP, no formato especificado, para fins de leitura, impressão e/ou download pela Internet a título de divulgação da produção científica gerada pela Universidade a partir desta data. | pt_BR |
dc.subject | Sensoriamento remoto | pt_BR |
dc.subject | Programação linear | pt_BR |
dc.subject | Sistemas de recuperação da informação – códigos numéricos | pt_BR |
dc.title | Análise de combinação de classificadores usando uma abordagem multiobjetivo baseada em acurácia e número de classificadores. | pt_BR |
dc.type | Dissertacao | pt_BR |
Arquivos
Pacote original
1 - 1 de 1
Nenhuma Miniatura Disponível
- Nome:
- DISSERTAÇÃO_AnáliseCombinaçãoClassificadores.pdf
- Tamanho:
- 5.7 MB
- Formato:
- Adobe Portable Document Format
Licença do pacote
1 - 1 de 1
Nenhuma Miniatura Disponível
- Nome:
- license.txt
- Tamanho:
- 1.71 KB
- Formato:
- Item-specific license agreed upon to submission
- Descrição: