DETECÇÃO DE DIABETES: UM ESTUDO COMPARATIVO ENTRE ALGORITMOS DE APRENDIZADO DE MÁQUINA

José Airton Azevedo dos Santos; Aldino Normelio Brun Polo; Cidmar Ortiz dos Santos

doi:10.17564/2316-3798.2025v10n1p389-404

DETECÇÃO DE DIABETES: UM ESTUDO COMPARATIVO ENTRE ALGORITMOS DE APRENDIZADO DE MÁQUINA

DOI:

https://doi.org/10.17564/2316-3798.2025v10n1p389-404

Authors

José Airton Azevedo dos Santos Universidade Tecnológica Federal do Paraná (UTFPR)
Aldino Normelio Brun Polo Universidade Tecnológica Federal do Paraná (UTFPR) https://orcid.org/0009-0000-2969-274X
Cidmar Ortiz dos Santos Universidade Tecnológica Federal do Paraná (UTFPR) https://orcid.org/0000-0002-1727-3676

Published

2025-07-17

Downloads

PDF/A (Português (Brasil))

Downloads

Download data is not yet available.

Issue

Vol. 10 No. 1 (2025): Fluxo Contínuo

Section

Artigos

License

This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License.

Autores que publicam nesta revista concordam com os seguintes termos:

a. Autores mantêm os direitos autorais e concedem à revista o direito de primeira publicação, com o trabalho simultaneamente licenciado sob a Licença Creative Commons Attribution que permite o compartilhamento do trabalho com reconhecimento da autoria e publicação inicial nesta revista.

b. Autores têm permissão e são estimulados a distribuir seu trabalho on-line (ex.: em repositórios institucionais ou na sua página pessoal), já que isso pode gerar aumento o impacto e a citação do trabalho publicado (Veja O Efeito do Acesso Livre).

Abstract

ABSTRACT

Diabetes, a disease that has been growing worldwide, leads to organ dysfunction and a risk of premature death. Currently, machine learning models are being used as an auxiliary tool in the diagnosis of diabetes. In this context, this work aims to compare the performance of the XGBoost (Xtreme Gradient Boosting) and LightGBM (Light Gradient Boosting Machine) models for detecting diabetes. The performance comparison was performed using the Pima Indian Diabetes database, the SMOTEENN technique for class balancing, and the Optuna hyperparameter tuning library. The classification models were implemented in the Python language. The metrics Accuracy, Precision, Sensitivity, F1-Score, AUC, and Kappa were used to evaluate the performance of the models. Experimental results demonstrated that the LightGBM model presented better classification performance than the XGBoost model (Accuracy=99.1%, AUC=0.99, and Kappa=0.981).

Author Biographies

Aldino Normelio Brun Polo, Universidade Tecnológica Federal do Paraná (UTFPR)

Mestrando do Programa de Pós-Graduação em Tecnologias Computacionais para o Agronegócio - PPGTCA

Cidmar Ortiz dos Santos, Universidade Tecnológica Federal do Paraná (UTFPR)

Doutor em Ensino de Ciência e Tecnologia.

How to Cite

Azevedo dos Santos, J. A., Brun Polo, A. N., & Ortiz dos Santos, C. (2025). DETECÇÃO DE DIABETES: UM ESTUDO COMPARATIVO ENTRE ALGORITMOS DE APRENDIZADO DE MÁQUINA. Interfaces Científicas - Saúde E Ambiente, 10(1), 389–404. https://doi.org/10.17564/2316-3798.2025v10n1p389-404