Navegando por Assunto "Análise estatística multivariada"
Agora exibindo 1 - 2 de 2
- Resultados por Página
- Opções de Ordenação
Item Análise de agrupamentos aplicada à setorização geotécnica de minas a céu aberto.(2020) Nazareth, Ana Flávia Delbem Vidigal; Lana, Milene Sabino; Lana, Milene Sabino; Pereira, Tiago Martins; Klen, André MonteiroEsta pesquisa objetiva aplicar a análise estatística multivariada de agrupamentos (clustering), através do algoritmo de agrupamento k-Protótipos, a um banco de dados geológico-geotécnico dos taludes de uma mina de minério de manganês, visando estudar a estrutura espacial dos dados, e propor uma nova setorização geotécnica da cava. O banco de dados consiste em um levantamento de parâmetros geológico-geotécnicos medidos diretamente em diversos pontos da mina, estruturado em vinte e oito variáveis. A metodologia utilizada foi composta de um estudo teórico e prático da análise multivariada de agrupamentos, em paralelo a um pré-tratamento do banco de dados para adequá-lo à realização da análise, realização de estatísticas descritivas dos dados e construção de gráficos auxiliares. Após estas etapas foi realizada a modificação da função kproto( ), do pacote clustMixType, em linguagem R, obtendo-se a função kproto.modif( ). Em seguida foi aplicada a técnica de agrupamentos ao banco de dados por meio do software R e do algoritmo de agrupamentos k-Protótipos (função kproto.modif( )), variando o número de grupos k e os pesos dados à cada variável. A relação entre as variáveis é expressa pela distância Euclidiana ao quadrado, para quantificar a distância entre as variáveis numéricas, e a distância a partir do coeficiente de similaridade de Jaccard, para as variáveis nominais. Os diferentes resultados de agrupamentos obtidos foram validados por meio da análise de variância multivariada (MANOVA), pelo uso de 100 sementes aleatórias iniciais do algoritmo e escolha do melhor resultado, e pela sobreposição dos pontos de cada grupo ao mapa geológico da mina. A identificação das estruturas de agrupamentos é seguida pela plotagem das mesmas no mapa em planta da mina (segundo as coordenadas espaciais de cada observação do banco de dados) e, posteriormente, pela subdivisão da área de investigação, e culmina na regionalização ou mapeamento da classificação no plano, definindo os setores geotécnicos propostos. As regiões são subdivisões da área do mapa que são espacialmente contíguas e relativamente homogêneas em suas propriedades geológico-geotécnicas, indicadas pela densidade espacial de pontos de um mesmo grupo. Foram propostos 7 setores geotécnicos para as regiões de domínio de maciços rochosos da mina. Cada setor proposto foi descrito segundo suas propriedades geológicas, mecânicas e estruturais. Observou-se uma grande aderência da setorização proposta à geologia da mina, indicando a representatividade prática dos resultados de agrupamentos obtidos e da setorização proposta.Item Classificação de maciços rochosos por meio de técnicas da estatística multivariada e inteligência artificial.(2021) Santos, Allan Erlikhman Medeiros; Lana, Milene Sabino; Pereira, Tiago Martins; Lana, Milene Sabino; Klen, André Monteiro; Cabral, Ivo Eyer; Bacellar, Luis de Almeida Prado; Parizzi, Maria GiovanaA presente pesquisa tem como objetivo a proposição de novos modelos para classificação de maciços rochosos brasileiros, baseados no sistema RMR. O banco de dados utilizado possui informações dos parâmetros básicos para obtenção do sistema Rock Mass Rating (RMR). Os modelos propostos são baseados em técnicas da estatística multivariada e técnicas de inteligência artificial. A seleção das variáveis foi feita a partir da análise fatorial. Os modelos de classificação foram treinados por meio de dois tipos de aprendizagem, a supervisionada e a não supervisionada. O processo de aprendizagem se baseia na identificação de padrões no comportamento das variáveis do banco de dados, estabelecendo modelos preditivos no processo de aprendizagem supervisionada e modelos descritivos na aprendizagem não-supervisionada. Portanto, na aprendizagem supervisionada a variável classe (target) deve ser fornecida ao algoritmo, já na aprendizagem não-supervisionada o algoritmo irá indicar os grupos (clusters) com base no comportamento das variáveis, posto isso os clusters são grupos constituídos de amostras similares, com variáveis com comportamento semelhante. Nos métodos supervisionados foram utilizadas as técnicas de redes neurais artificiais, naïve Bayes, random forest e máquinas de vetores de suporte. Para o modelo por aprendizagem não supervisionada foi utilizado o algoritmo partitioning around medoids. A utilização destes métodos quantitativos reduz a subjetividade dos sistemas propostos. O resultado da análise fatorial permitiu a identificação de três fatores comuns, Fator 1, relacionado à resistência e à alteração da rocha; Fator 3, relacionado ao grau de fraturamento do maciço rochoso e Fator 2, relacionado à condição e presença de água no maciço. Assim, a partir da análise fatorial foi feita a seleção das variáveis para o sistema de classificação. Posto isso, um número menor de variáveis foi utilizado, o que difere do sistema de classificação RMR. Os modelos treinados por aprendizagem supervisionada se adequaram à solução do problema abordado, com excelente desempenho para modelos preditivos, apresentando altas taxas de acurácia, precisão e eficácia. Os valores médios de acurácia dos modelos treinados foram de 0,81; 0,89; 0,87 e 0,89 para naïve Bayes, random forest, redes neurais artificiais e máquinas de vetores de suporte, respectivamente. Estes resultados mostraram a possibilidade de definir as classes do RMR com um número menor de variáveis, e que as variáveis selecionadas são realmente os parâmetros mais importantes para determinar a qualidade do maciço rochoso. O modelo treinado pela aprendizagem não supervisionada indicou a formação de 7 grupos, rotulados a partir da V interpretação dos valores das variáveis em cada grupo em conjunto com o valor da variável Pontuação. Os grupos formados foram a Classe A com maciços com resistência alta, pouco alterado, pouco fraturado e seco; Classe B com maciços com resistência média, pouco alterado, com fraturamento médio e seco; Classe C com maciços com resistência alta, pouco alterado, com fraturamento médio e molhado; Classe D com maciços com resistência baixa, muito alterado, pouco fraturado e seco; Classe E com maciços com resistência média, alteração média, com fraturamento médio e molhado; Classe F com maciço com resistência baixa, alteração alta, pouco fraturado e molhado; por fim a Classe G com maciço com resistência baixa, alteração alta, muito fraturado e molhado. O trabalho apresenta novas abordagens para lidar com sistemas de classificação de maciços rochosos, diminuindo a subjetividade, aumentando a seletividade dos parâmetros, reduzindo a dimensionalidade de bancos de dados geotécnicos e otimizando a aplicação de sistemas de classificação. Embora a matemática das técnicas aplicadas seja complexa, os resultados são de fácil interpretação e aplicação. Assim, acredita-se na confiabilidade dos modelos preditivos propostos, além da possibilidade de otimização por meio da utilização de bases de dados mais amplas.