Detecção de fraudes financeiras em contas digitais : explorando abordagens hierárquicas e técnicas de aprendizado profundo.
dc.contributor.advisor | Luz, Eduardo José da Silva | pt_BR |
dc.contributor.advisor | Moreira, Gladston Juliano Prates | pt_BR |
dc.contributor.author | Souza, Andressa Oliveira | |
dc.contributor.referee | Luz, Eduardo José da Silva | pt_BR |
dc.contributor.referee | Moreira, Gladston Juliano Prates | pt_BR |
dc.contributor.referee | Lima, Helen de Cássia Sousa da Costa | pt_BR |
dc.contributor.referee | Silva, Rodrigo César Pedrosa | pt_BR |
dc.contributor.referee | Oliveira, Samuel Evangelista Lima de | pt_BR |
dc.date.accessioned | 2023-09-26T20:29:15Z | |
dc.date.available | 2023-09-26T20:29:15Z | |
dc.date.issued | 2023 | pt_BR |
dc.description | Programa de Pós-Graduação em Ciência da Computação. Departamento de Ciência da Computação, Instituto de Ciências Exatas e Biológicas, Universidade Federal de Ouro Preto. | pt_BR |
dc.description.abstract | Nos últimos anos, houve um aumento na oferta de serviços financeiros por meio de aplicativos e internet banking, mas isso também levou a um aumento de contas digitais fraudulentas. Em problemas de detecção de fraudes financeiras, é comum encontrar um desbalanceamento significativo entre amostras não fraudulentas e fraudulentas, dificultando sua identificação. Dessa forma, este trabalho aborda a detecção dessas contas, utilizando métodos de sobreamostragem e classificação hierárquica para lidar com o desbalanceamento das classes. Também é investigado se o uso de deep learning com dados matriciais pode superar os classificadores tradicionais Random Forest e XGBoost. Os dados foram fornecidos pela Efí S.A. e incluem 45.209 contas organizadas de forma hierárquica. As contas são categorizadas em primeiro nível como Fraude ou Não Fraude, e no segundo nível, as não fraudes são divididas em quatro classes (A, B, C e D), enquanto as fraudes são divididas em duas (E e F). O problema foi abordado como classificação binária e multiclasse. A análise abrangente revelou que o uso dos métodos de sobreamostragem SMOTE e Borderline SMOTE melhorou as métricas de Sensibilidade e F-score para as classes fraudulentas nos classificadores tradicionais, na classificação binária e na multiclasse. A abordagem hierárquica destacou-se nas métricas de Precisão e F-score para as classes E e F, enquanto a abordagem plana apresentou o melhor desempenho em Sensibilidade para essas classes. O uso de deep learning com dados matriciais superou os classificadores tradicionais apenas na métrica de Sensibilidade na classificação binária. | pt_BR |
dc.description.abstracten | In recent years, there has been an increase in the provision of financial services through applications and internet banking, but this has also led to a rise in fraudulent digital accounts. In financial fraud detection problems, it is common to encounter a significant class imbalance between non-fraudulent and fraudulent samples, making their identification challenging. Thus, this work addresses the detection of these accounts by using oversampling methods and hierarchical classification to deal with class imbalance. It also investigates whether the use of deep learning with matrix data can outperform the traditional classifiers Random Forest and XGBoost. The data was provided by Ef ́ı S.A. and includes 45,209 hierarchically organized accounts. The accounts are categorized at the first level as Fraud or Non-Fraud, and at the second level, the non-fraud accounts are further divided into four classes (A, B, C, and D), while the fraud accounts are divided into two classes (E and F). The problem was approached as binary and multiclass classification. The comprehensive analysis revealed that the use of oversampling methods SMOTE and Borderline SMOTE improved the Sensitivity and F-score metrics for the fraudulent classes in the traditional classifiers, in both binary and multiclass classification. The hierarchical approach stood out in the Precision and F-score metrics for classes E and F, while the flat approach showed the best performance in Sensitivity for these classes. The use of deep learning with matrix data outperformed the traditional classifiers only in the Sensitivity metric in binary classification. | pt_BR |
dc.identifier.citation | SOUZA, Andressa Oliveira. Detecção de fraudes financeiras em contas digitais: explorando abordagens hierárquicas e técnicas de aprendizado profundo. 2023. 125 f. Dissertação (Mestrado em Ciência da Computação) - Instituto de Ciências Exatas e Biológicas, Universidade Federal de Ouro Preto, Ouro Preto, 2023. | pt_BR |
dc.identifier.uri | http://www.repositorio.ufop.br/jspui/handle/123456789/17482 | |
dc.language.iso | pt_BR | pt_BR |
dc.rights | aberto | pt_BR |
dc.rights.license | Autorização concedida ao Repositório Institucional da UFOP pelo(a) autor(a) em 15/09/2023 com as seguintes condições: disponível sob Licença Creative Commons 4.0 que permite copiar, distribuir e transmitir o trabalho, desde que sejam citados o autor e o licenciante. Não permite o uso para fins comerciais nem a adaptação. | pt_BR |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/3.0/us/ | * |
dc.subject | Fraude | pt_BR |
dc.subject | Redes neurais | pt_BR |
dc.subject | Classificação hierárquica | pt_BR |
dc.title | Detecção de fraudes financeiras em contas digitais : explorando abordagens hierárquicas e técnicas de aprendizado profundo. | pt_BR |
dc.type | Dissertacao | pt_BR |
Arquivos
Pacote original
1 - 1 de 1
Nenhuma Miniatura Disponível
- Nome:
- DISSERTAÇÃO_DetecçãoFraudesFinanceiras.pdf
- Tamanho:
- 6.3 MB
- Formato:
- Adobe Portable Document Format
- Descrição:
Licença do pacote
1 - 1 de 1
Nenhuma Miniatura Disponível
- Nome:
- license.txt
- Tamanho:
- 1.71 KB
- Formato:
- Item-specific license agreed upon to submission
- Descrição: