PPGCC - Doutorado (Teses)
URI permanente para esta coleçãohttp://www.hml.repositorio.ufop.br/handle/123456789/9837
Navegar
Item Hybrid feature selection approaches using metaheuristics for hierarchical classification.(2021) Lima, Helen de Cássia Sousa da Costa; Souza, Marcone Jamilson Freitas; Merschmann, Luiz Henrique de Campos; Souza, Marcone Jamilson Freitas; Merschmann, Luiz Henrique de Campos; Toffolo, Túlio Ângelo Machado; Luz, Eduardo José da Silva; Cerri, Ricardo; Barril Otero, Fernando EstebanA seleção de atributos é uma etapa de pré-processamento amplamente difundida na área de mineração de dados. Um de seus objetivos é reduzir o número de atributos originais de uma base de dados para melhorar o desempenho de um modelo preditivo. No entanto, apesar dos benefícios da seleção de atributos para a tarefa de classificação, até onde sabemos, poucos estudos na literatura abordam a seleção de atributos para o contexto de classificação hierárquica. Este trabalho propõe duas abordagens principais de seleção híbrida de atributos supervisionada, combinando uma etapa filtro com uma wrapper, na qual um classificador hierárquico global avalia subconjuntos de atributos. A primeira abordagem usa a metaheurística Busca em Vizinhança Variável Geral com um ranqueamento de atributos construído com a medida Incerteza Simétrica Hierárquica. A segunda abordagem propõe uma adaptação da medida de seleção de atributos baseada em correlação adaptada para classificação hierárquica e utiliza o algoritmo Best First Search para pesquisar o espaço de subconjuntos de atributos. Doze bases de dados dos domínios de proteína e imagem foram usadas para realizar experimentos computacionais para validar o desempenho dos algoritmos propostos utilizando dois classificadores hierárquicos globais propostos na literatura. Testes estatísticos mostraram que o uso dos métodos de seleção de atributos propostos levaram a um desempenho preditivo consistentemente melhor ou equivalente ao obtido quando todos os atributos iniciais são utilizados, além do benefício de reduzir o número de atributos necessários, o que justifica a aplicação em cenários de classificação hierárquica.