DETECÇÃO DE DIABETES: UM ESTUDO COMPARATIVO ENTRE ALGORITMOS DE APRENDIZADO DE MÁQUINA
DOI:
https://doi.org/10.17564/2316-3798.2025v10n1p389-404Published
Downloads
Downloads
Issue
Section
License
Copyright (c) 2025 Interfaces Científicas - Saúde e Ambiente

This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License.
Autores que publicam nesta revista concordam com os seguintes termos:
a. Autores mantêm os direitos autorais e concedem à revista o direito de primeira publicação, com o trabalho simultaneamente licenciado sob a Licença Creative Commons Attribution que permite o compartilhamento do trabalho com reconhecimento da autoria e publicação inicial nesta revista.
b. Autores têm permissão e são estimulados a distribuir seu trabalho on-line (ex.: em repositórios institucionais ou na sua página pessoal), já que isso pode gerar aumento o impacto e a citação do trabalho publicado (Veja O Efeito do Acesso Livre).
Abstract
ABSTRACT
Diabetes, a disease that has been growing worldwide, leads to organ dysfunction and a risk of premature death. Currently, machine learning models are being used as an auxiliary tool in the diagnosis of diabetes. In this context, this work aims to compare the performance of the XGBoost (Xtreme Gradient Boosting) and LightGBM (Light Gradient Boosting Machine) models for detecting diabetes. The performance comparison was performed using the Pima Indian Diabetes database, the SMOTEENN technique for class balancing, and the Optuna hyperparameter tuning library. The classification models were implemented in the Python language. The metrics Accuracy, Precision, Sensitivity, F1-Score, AUC, and Kappa were used to evaluate the performance of the models. Experimental results demonstrated that the LightGBM model presented better classification performance than the XGBoost model (Accuracy=99.1%, AUC=0.99, and Kappa=0.981).