Métrica para validação de modelos preditivos classificatórios para prever o risco de ataque cardíaco

Autores

DOI:

https://doi.org/10.22567/rep.v14i1.1072

Palavras-chave:

Métrica estatística, Machine Learning, Inteligência Artificial, F-score, Acurácia

Resumo

A presença dos métodos de aprendizado da máquina hoje é uma constante em todos os discursos referentes à relação entre o homem e a máquina, desde palestras em cursos universitários à discursos políticos. Todo o desenvolvimento deste trabalho foi efetuado em linguagem Python, utilizando bibliotecas pré-definidas, uma vez que já se conhece que a linguagem é propícia para análise de dados e Data Science. Destaca-se o potencial desses modelos de machine learning na previsão de eventos cardiovasculares, oferecendo uma oportunidade para identificar precocemente pacientes em risco e personalizar intervenções para melhorar os resultados e a qualidade de vida. Esta pesquisa buscou aplicar e avaliar as métricas de acurácia, precisão, recall, f1-score, FMI e AUC da curva ROC para validar os resultados da predição do Random Forest quanto ao risco de infarto do miocárdio em um banco de dados de 918 pacientes.

Referências

Andrade, M., Santos, J. & Freitas, J. (2023). Sistema de detecção de intrusão utilizando métodos de aprendizagem de máquina em redes de computadores. Revista de ciência e inovação do IFFAR, 09. doi:10.26669/2448-4091.2023.388

Belloni, M. & Righetto, A. J. (2024). Random Forest para classificação em relação ao risco de infarto do miocárdio. Monografia, Universidade de São Paulo / USP - Esalq, Data Science and Analytics.

Bruna, M. H. (2023). Infarto do miocárdio (ataque cardíaco). Acesso em 12 de 02 de 2024, disponível em drauzio varella - drauzio varella: https://drauziovarella.uol.com.br/doencas-e-sintomas/infarto-do-miocardio-ataque-cardiaco/

Fernando, P. H. L.; Fabricio, D. A. K.; Trevisan, L.; Lixandrão, K. C. de L. & Lima, C. R. G. (2023). Metrologia. São Paulo: Grupo A.

Ho, T. K. (1995). Random Decision Forests. Proceedings of 3rd International Conference on Document Analysis and Recognition, pp. 278-282. Fonte: https://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=598994

Kaggle. (2024). Your Machine Learning and Data Science Community. Acesso em 26 de 11 de 24, disponível em https://www.kaggle.com

Martinez, E. Z. & Louzada Neto, F. (2003). A curva ROC para testes diagnósticos. Caderno de saúde coletiva, pp. 7-31.

Martins, A. d. (2023). Epidemiologia. São Paulo: Grupo A.

Mello, J. F. (2023.). Anotações de aula. Árvores, Redes e Ensemble Models I e II. MBA em Data Science & Analytics. . Piracicaba/ SP.: USP/Esalq.

Olson, D. & Delen, D. (2008). Advanced Data Mining Techniques. Heidelberg, Alemanha.: Springer.

sklearn.ensemble.RandomForestClassifier. (2024). Acesso em 20 de 01 de 2024, disponível em Scikit learn 1.3: https://scikit-learn.org/stable/modules/generated/sklearn.ensemble.RandomForestClassifier.html

Strauss, E., Bôas Junior, M. V., & Ferreira, W. L. (2022). A importância de utilizar métricas adequadas de avaliação de performance em modelos preditivos de machine learning. Projectus, 7, pp. 57-62. doi:10.15202/25254146.2022v7n2p52

Vilela Junior, G. d. (2022a). Determinação das métricas usuais a partir da matriz de confusão de classificadores multiclasse em algoritmos inteligentes nas ciências do movimento humano. Revista Centro de Pesquisas Avançadas em Qualidade de Vida, 14(2). doi:10.36692/v14n2-01

Vilela Junior, G. d. (2022b). Importância do índice Fowlkes-Mallows (FMI), do coeficientede correlação de Matthews (MCC) e do índice Youden (IY) nosclassificadores de inteligência artificial na área da saúde. Revista CPAQV – Centro de Pesquisas Avançadas em Qualidade de Vi, 14(3). doi:10.36692/v14n3-01

Downloads

Publicado

2025-04-02

Como Citar

Belloni, M., & Carvalho, J. (2025). Métrica para validação de modelos preditivos classificatórios para prever o risco de ataque cardíaco. REVISTA ENIAC PESQUISA, 14(1), 28–42. https://doi.org/10.22567/rep.v14i1.1072

Edição

Seção

Artigos