IA generativa open source en el análisis de datos sobre la diabetes: Un enfoque con LLMs y HSNW para la clasificación eficiente de datos de salud

Resumen

La diabetes constituye un serio problema de salud pública, especialmente en Ecuador, donde se ubica entre las principales causas de mortalidad y mantiene un alto porcentaje de casos no diagnosticados. Ante esta realidad, la presente investigación analiza el potencial de la inteligencia artificial (IA) generativa de código abierto para optimizar el análisis masivo de datos relacionados con esta enfermedad. Se abordan conceptos clave como los Grandes Modelos de Lenguaje (LLMs), la arquitectura Transformer y los embeddings, los cuales sustentan la propuesta metodológica desarrollada. La metodología planteada se compone de tres etapas principales. En primer lugar, Embeddings, donde los datos de salud se transforman en representaciones vectoriales que permiten detectar similitudes entre registros. En segundo lugar, se implementa el método HSNW (Hierarchical Navigable Small Worlds), que posibilita realizar búsquedas eficientes en espacios de alta dimensionalidad, reduciendo significativamente la complejidad computacional. Finalmente, se incorporan los LLMs como una capa adicional de discriminación y categorización sobre los datos previamente procesados. Asimismo, se examinan frameworks de código abierto como LangGraph, útiles para la gestión y orquestación de flujos de trabajo complejos en entornos de IA. La integración de estas tres tecnologías Embeddings, HSNW y LLMs busca incrementar la eficiencia, optimizar el rendimiento del procesamiento de información y disminuir los costos asociados a la clasificación de datos de salud a gran escala. En conjunto, este enfoque propone un modelo innovador y escalable para fortalecer el análisis y diagnóstico temprano de la diabetes mediante herramientas de inteligencia artificial.

Presentadores

Kevin David Farinango Cinilin
Student, PhD en informática , Universidad Americana de Europa, Pichincha, Ecuador

Rodrigo Cadena
Professor-researcher, Informatics, Universidad Americana de Europa (UNADE), Quintana Roo, Mexico

Details

Presentation Type

Ponencia temática de un trabajo

Theme

Las ciencias de la salud interdisciplinares

KEYWORDS

Diabetes, Inteligencia Artificial, LLMs, Embeddings, HSNW, LangGraph