Detecção de fraudes financeiras em contas digitais : explorando abordagens hierárquicas e técnicas de aprendizado profundo.

Souza, Andressa Oliveira

Detecção de fraudes financeiras em contas digitais : explorando abordagens hierárquicas e técnicas de aprendizado profundo.

dc.contributor.advisor	Luz, Eduardo José da Silva	pt_BR
dc.contributor.advisor	Moreira, Gladston Juliano Prates	pt_BR
dc.contributor.author	Souza, Andressa Oliveira
dc.contributor.referee	Luz, Eduardo José da Silva	pt_BR
dc.contributor.referee	Moreira, Gladston Juliano Prates	pt_BR
dc.contributor.referee	Lima, Helen de Cássia Sousa da Costa	pt_BR
dc.contributor.referee	Silva, Rodrigo César Pedrosa	pt_BR
dc.contributor.referee	Oliveira, Samuel Evangelista Lima de	pt_BR
dc.date.accessioned	2023-09-26T20:29:15Z
dc.date.available	2023-09-26T20:29:15Z
dc.date.issued	2023	pt_BR
dc.description	Programa de Pós-Graduação em Ciência da Computação. Departamento de Ciência da Computação, Instituto de Ciências Exatas e Biológicas, Universidade Federal de Ouro Preto.	pt_BR
dc.description.abstract	Nos últimos anos, houve um aumento na oferta de serviços financeiros por meio de aplicativos e internet banking, mas isso também levou a um aumento de contas digitais fraudulentas. Em problemas de detecção de fraudes financeiras, é comum encontrar um desbalanceamento significativo entre amostras não fraudulentas e fraudulentas, dificultando sua identificação. Dessa forma, este trabalho aborda a detecção dessas contas, utilizando métodos de sobreamostragem e classificação hierárquica para lidar com o desbalanceamento das classes. Também é investigado se o uso de deep learning com dados matriciais pode superar os classificadores tradicionais Random Forest e XGBoost. Os dados foram fornecidos pela Efí S.A. e incluem 45.209 contas organizadas de forma hierárquica. As contas são categorizadas em primeiro nível como Fraude ou Não Fraude, e no segundo nível, as não fraudes são divididas em quatro classes (A, B, C e D), enquanto as fraudes são divididas em duas (E e F). O problema foi abordado como classificação binária e multiclasse. A análise abrangente revelou que o uso dos métodos de sobreamostragem SMOTE e Borderline SMOTE melhorou as métricas de Sensibilidade e F-score para as classes fraudulentas nos classificadores tradicionais, na classificação binária e na multiclasse. A abordagem hierárquica destacou-se nas métricas de Precisão e F-score para as classes E e F, enquanto a abordagem plana apresentou o melhor desempenho em Sensibilidade para essas classes. O uso de deep learning com dados matriciais superou os classificadores tradicionais apenas na métrica de Sensibilidade na classificação binária.	pt_BR
dc.description.abstracten	In recent years, there has been an increase in the provision of financial services through applications and internet banking, but this has also led to a rise in fraudulent digital accounts. In financial fraud detection problems, it is common to encounter a significant class imbalance between non-fraudulent and fraudulent samples, making their identification challenging. Thus, this work addresses the detection of these accounts by using oversampling methods and hierarchical classification to deal with class imbalance. It also investigates whether the use of deep learning with matrix data can outperform the traditional classifiers Random Forest and XGBoost. The data was provided by Ef ́ı S.A. and includes 45,209 hierarchically organized accounts. The accounts are categorized at the first level as Fraud or Non-Fraud, and at the second level, the non-fraud accounts are further divided into four classes (A, B, C, and D), while the fraud accounts are divided into two classes (E and F). The problem was approached as binary and multiclass classification. The comprehensive analysis revealed that the use of oversampling methods SMOTE and Borderline SMOTE improved the Sensitivity and F-score metrics for the fraudulent classes in the traditional classifiers, in both binary and multiclass classification. The hierarchical approach stood out in the Precision and F-score metrics for classes E and F, while the flat approach showed the best performance in Sensitivity for these classes. The use of deep learning with matrix data outperformed the traditional classifiers only in the Sensitivity metric in binary classification.	pt_BR
dc.identifier.citation	SOUZA, Andressa Oliveira. Detecção de fraudes financeiras em contas digitais: explorando abordagens hierárquicas e técnicas de aprendizado profundo. 2023. 125 f. Dissertação (Mestrado em Ciência da Computação) - Instituto de Ciências Exatas e Biológicas, Universidade Federal de Ouro Preto, Ouro Preto, 2023.	pt_BR
dc.identifier.uri	http://www.repositorio.ufop.br/jspui/handle/123456789/17482
dc.language.iso	pt_BR	pt_BR
dc.rights	aberto	pt_BR
dc.rights.license	Autorização concedida ao Repositório Institucional da UFOP pelo(a) autor(a) em 15/09/2023 com as seguintes condições: disponível sob Licença Creative Commons 4.0 que permite copiar, distribuir e transmitir o trabalho, desde que sejam citados o autor e o licenciante. Não permite o uso para fins comerciais nem a adaptação.	pt_BR
dc.rights.uri	http://creativecommons.org/licenses/by-nc-nd/3.0/us/	*
dc.subject	Fraude	pt_BR
dc.subject	Redes neurais	pt_BR
dc.subject	Classificação hierárquica	pt_BR
dc.title	Detecção de fraudes financeiras em contas digitais : explorando abordagens hierárquicas e técnicas de aprendizado profundo.	pt_BR
dc.type	Dissertacao	pt_BR

Arquivos

Pacote original

Agora exibindo 1 - 1 de 1

Nome:: DISSERTAÇÃO_DetecçãoFraudesFinanceiras.pdf
Tamanho:: 6.3 MB
Formato:: Adobe Portable Document Format
Descrição:

Baixar

Licença do pacote

Agora exibindo 1 - 1 de 1

Nome:: license.txt
Tamanho:: 1.71 KB
Formato:: Item-specific license agreed upon to submission
Descrição:

Baixar

Coleções

PPGCC - Mestrado (Dissertações)