PPGCC - Mestrado (Dissertações)

URI permanente para esta coleçãohttp://www.hml.repositorio.ufop.br/handle/123456789/597

Navegar

Resultados da Pesquisa

Agora exibindo 1 - 1 de 1
  • Item
    Desenvolvimento de técnicas de seleção de atributos no contexto da classificação hierárquica monorrótulo.
    (2015) Dias, Thieres Nardy; Merschmann, Luiz Henrique de Campos
    A seleção de atributos, tradicionalmente adotada como uma etapa de pré-processamento dos dados, tem como objetivo principal identificar os atributos relevantes para a tarefa de classificação. No entanto, para o cenário de classificação hierárquica, onde as classes a serem preditas estão estruturadas de acordo com uma hierarquia, poucos trabalhos na literatura apresentam propostas de técnicas de seleção de atributos. Mais especificamente, para problemas de classificação hierárquica monorrótulo, não foram encontradas na literatura técnicas de seleção de atributos que possam ser utilizadas em conjunto com classificadores hierárquicos globais, ou seja, classificadores que são treinados levando-se em consideração toda a hierarquia de classes de uma só vez. Desse modo, neste trabalho propomos uma adaptação da medida Incerteza Simétrica (Symmetrical Uncertainty { SU) para permitir que ela possa ser utilizada em técnicas de seleção de atributos para problemas de classificação hierárquica monorrótulo que usam classificadores hierárquicos globais. Posteriormente, utilizamos essa adaptação proposta, denominada Incerteza Simétrica Hierárquica (Hierarchical Symmetrical Uncertainty { SUH), em duas técnicas distintas de seleção de atributos: uma que faz uso da abordagem Filtro e outra que segue uma abordagem Híbrida (Filtro e Wrapper). A técnica que implementa a abordagem Híbrida corresponde a uma heurística que utiliza o classificador hierárquico Global-Model Naive Bayes (GMNB) para avaliar os subconjuntos de atributos. A partir das duas técnicas de seleção de atributos propostas neste trabalho, pudemos verificar a adequação da adaptação da medida SU para o cenário hierárquico. Além disso, o método heurístico proposto, nomeado como Hybrid Feature Selection for Hierarchical Classification (HFS4HC), apresentou resultados bastante promissores para o contexto da classificação hierárquica monorrótulo.