DETECÇÃO DE DIABETES: UM ESTUDO COMPARATIVO ENTRE ALGORITMOS DE APRENDIZADO DE MÁQUINA
DOI :
https://doi.org/10.17564/2316-3798.2025v10n1p389-404Publié-e
Téléchargements
Téléchargements
Numéro
Rubrique
Licence
© Interfaces Científicas - Saúde e Ambiente 2025

Cette œuvre est sous licence Creative Commons Attribution - Pas d'Utilisation Commerciale 4.0 International.
Autores que publicam nesta revista concordam com os seguintes termos:
a. Autores mantêm os direitos autorais e concedem à revista o direito de primeira publicação, com o trabalho simultaneamente licenciado sob a Licença Creative Commons Attribution que permite o compartilhamento do trabalho com reconhecimento da autoria e publicação inicial nesta revista.
b. Autores têm permissão e são estimulados a distribuir seu trabalho on-line (ex.: em repositórios institucionais ou na sua página pessoal), já que isso pode gerar aumento o impacto e a citação do trabalho publicado (Veja O Efeito do Acesso Livre).
Résumé
RESUMO
O diabetes, doença que tem crescido em todo o mundo, leva a disfunção orgânica e a um risco de morte prematura. Atualmente, modelos de machine learning estão sendo utilizados como ferramenta auxiliar no diagnóstico de diabetes. Neste contexto, este trabalho tem como objetivo comparar o desempenho dos modelos XGBoost (Xtreme Gradient Boosting) e LighGBM (Light Gradient Boosting Machine) para detecção de diabetes. Utilizou-se, para realizar a comparação de desempenho, a base de dados Pima Indian Diabetes, a técnica SMOTEENN para balanceamento das classes e a biblioteca de ajuste de hiperparâmetros Optuna. Os modelos de classificação foram implementados na linguagem Python. As métricas Accuracy, Precision, Sensitivity, F1-Score, AUC e Kappa foram utilizadas para avaliar o desempenho dos modelos. Resultados experimentais demonstraram que o modelo LighGBM apresentou, com relação ao modelo XGBoost, um melhor desempenho de classificação (Accuracy=99,1%, AUC=0,99 e Kappa=0,981).