DETECÇÃO DE DIABETES: UM ESTUDO COMPARATIVO ENTRE ALGORITMOS DE APRENDIZADO DE MÁQUINA
DOI:
https://doi.org/10.17564/2316-3798.2025v10n1p389-404Publicado
Descargas
Descargas
Número
Sección
Licencia
Derechos de autor 2025 Interfaces Científicas - Saúde e Ambiente

Esta obra está bajo una licencia internacional Creative Commons Atribución-NoComercial 4.0.
Autores que publicam nesta revista concordam com os seguintes termos:
a. Autores mantêm os direitos autorais e concedem à revista o direito de primeira publicação, com o trabalho simultaneamente licenciado sob a Licença Creative Commons Attribution que permite o compartilhamento do trabalho com reconhecimento da autoria e publicação inicial nesta revista.
b. Autores têm permissão e são estimulados a distribuir seu trabalho on-line (ex.: em repositórios institucionais ou na sua página pessoal), já que isso pode gerar aumento o impacto e a citação do trabalho publicado (Veja O Efeito do Acesso Livre).
Resumen
RESUMEN
La diabetes, una enfermedad que está aumentando en todo el mundo, provoca disfunción orgánica y riesgo de muerte prematura. Actualmente, los modelos de machine learning se están utilizando como herramienta auxiliar en el diagnóstico de la diabetes. En este contexto, este trabajo tiene como objetivo comparar el rendimiento de los modelos XGBoost (Xtreme Gradient Boosting) y LighGBM (Light Gradient Boosting Machine) para la detección de diabetes. Para realizar la comparación del rendimiento se utilizaron la base de datos Pima Indian Diabetes, la técnica SMOTEENN para el equilibrio de clases y la biblioteca de ajuste de hiperparámetros Optuna. Los modelos de clasificación se implementaron en el lenguaje Python. Se utilizaron las métricas Accuracy, Precision, Sensitivity, F1-Score, AUC e Kappa para evaluar el desempeño de los modelos. Los resultados experimentales demostraron que el modelo LighGBM presentó, en relación al modelo XGBoost, un mejor desempeño de clasificación (Accuracy=99,1%, AUC=0,99 e Kappa=0,981).