PulsoSano Salud · Evidencia · LatAm
Investigación Clínica Publicado el · 3 min de lectura

IA generativa en atención primaria de Kenia: ensayo clínico no muestra reducción de fallas

Un ensayo aleatorizado en 16 centros de salud de Kenia evaluó si la asistencia de un modelo de lenguaje grande (LLM) reducía las fallas de tratamiento en atención primaria. El resultado principal no mostró diferencia significativa entre el grupo con IA y el grupo control, aunque la intervención fue considerada segura.

Por Revisado según nuestra metodología editorial

Un experimento real, no un laboratorio #

La mayoría de los estudios sobre inteligencia artificial (IA) en medicina se realizan en condiciones controladas o con casos clínicos hipotéticos. Un ensayo publicado en Nature Medicine por Agweyu, Mwaniki, Menon y colaboradores tomó un camino diferente: probó un sistema de apoyo a decisiones clínicas basado en un modelo de lenguaje grande (LLM, por sus siglas en inglés) directamente en 16 centros de atención primaria reales en Kenia, entre el 22 de abril y el 16 de julio de 2025.

Contexto: por qué Kenia y por qué ahora #

África subsahariana enfrenta una de las mayores escaseces de médicos del mundo: aproximadamente 0,3 médicos por cada 1.000 habitantes, menos del 10 % del promedio de los países de la OCDE (3,9 por 1.000), según datos citados en el estudio. En Kenia, como en muchos otros países, la atención primaria recae frecuentemente en clinical officers —profesionales de nivel medio con tres años de formación en medicina clínica— que deben tomar decisiones diagnósticas y terapéuticas complejas sin acceso a consulta especializada. Los autores señalan que el 60 % de las muertes por condiciones tratables en países de ingresos bajos y medios ocurre en personas que ya habían accedido al sistema de salud, lo que subraya que el problema no es solo el acceso, sino la calidad de la atención.

Qué se hizo y qué se midió #

El ensayo siguió un diseño pragmático y aleatorizado por conglomerados (cluster-randomized trial): los 103 clinical officers participantes fueron asignados aleatoriamente a usar el expediente electrónico habitual con o sin asistencia del LLM. En total, 9.691 pacientes fueron incluidos —4.693 en el grupo con IA y 4.654 en el grupo control—.

El resultado principal fue un indicador compuesto de fallas de tratamiento evaluadas por expertos independientes dentro de los 14 días posteriores a la consulta. Las fallas de tratamiento ocurrieron en 102 pacientes del grupo con IA (2,2 %) y en 94 del grupo control (2,0 %). La diferencia no fue estadísticamente significativa: la razón de momios ajustada fue de 0,77 (intervalo de confianza del 95 %: 0,55 a 1,08; P = 0,13), según reportan los autores.

Qué significan estos resultados #

En términos simples, el sistema de IA no redujo de forma demostrable las fallas de tratamiento en comparación con la práctica habitual. Los investigadores concluyen que, si existe algún beneficio, probablemente es modesto. Al mismo tiempo, destacan que no se registraron eventos adversos graves atribuibles a la intervención y que una revisión independiente no identificó señales de seguridad preocupantes. Esto significa que la herramienta fue segura en este contexto, aunque no eficaz en el indicador principal evaluado.

Es importante no extrapolar estos resultados a todos los posibles usos de la IA en salud: el estudio evaluó un sistema específico, en un contexto específico (atención primaria de recursos limitados en Kenia) y con un resultado específico (fallas de tratamiento a 14 días). Otras aplicaciones, poblaciones o métricas podrían arrojar resultados distintos.

Limitaciones del estudio #

Los propios autores reconocen que la evidencia rigurosa sobre el desempeño de los LLM en entornos clínicos reales y de bajos recursos sigue siendo limitada. El período de seguimiento fue de solo 14 días, lo que podría no capturar efectos a más largo plazo. Además, el ensayo se realizó en un contexto geográfico y sanitario particular, lo que limita la generalización directa a otros países o sistemas de salud.

Cierre #

Este ensayo representa uno de los primeros intentos rigurosos de medir el impacto real de la IA generativa en la atención primaria de un país de ingresos bajos y medios. Sus resultados invitan a la cautela frente a expectativas excesivas, pero también abren la puerta a investigaciones futuras que refinen el diseño de estas herramientas para entornos con recursos limitados.

Si usted o su institución están considerando incorporar herramientas de IA en la toma de decisiones clínicas, es fundamental consultar con profesionales de la salud calificados y evaluar la evidencia disponible antes de implementar cualquier cambio en la práctica médica.

Fuente original: Agweyu A., Mwaniki P., Menon V. et al. “Generative AI-enabled clinical decision support system in primary care: a pragmatic, cluster-randomized trial.” Nature Medicine (2026). https://doi.org/10.1038/s41591-026-04503-6

Preguntas frecuentes

¿Qué es un modelo de lenguaje grande (LLM) y cómo se usó en este estudio?

Un LLM es un sistema de inteligencia artificial capaz de interpretar texto clínico y generar recomendaciones. En este ensayo, se integró al expediente electrónico de los centros de salud para asistir a los profesionales de atención primaria en sus decisiones diagnósticas y terapéuticas, según describen los autores.

¿La IA redujo los errores de tratamiento en los pacientes del estudio?

No de forma estadísticamente significativa. Según el estudio, las fallas de tratamiento ocurrieron en el 2,2 % del grupo con IA y en el 2,0 % del grupo control, una diferencia que los autores consideran no significativa (P = 0,13).

¿Fue seguro usar IA para apoyar decisiones clínicas en este contexto?

Los investigadores reportaron que no se registraron eventos adversos graves relacionados con la intervención y que una revisión independiente no identificó señales de seguridad preocupantes, por lo que la herramienta fue considerada segura en este ensayo específico.

¿Estos resultados aplican a todos los países o sistemas de salud?

No necesariamente. El estudio se realizó en 16 centros de atención primaria de Kenia con características particulares de recursos y personal, por lo que los autores advierten que la generalización a otros contextos debe hacerse con cautela.

Fuente original: Nature Medicine

Artículo divulgativo reescrito en español por PulsoSano. Consulta el original para detalles técnicos y referencias bibliográficas completas.

Compartir

Etiquetas

#inteligencia-artificial#atencion-primaria#ensayo-clinico#modelos-de-lenguaje#africa-subsahariana#decision-clinica

Más en Investigación Clínica

Realidad virtual y neuroestimulación mejoran recuperación del brazo tras un ACV
Investigación Clínica

Realidad virtual y neuroestimulación mejoran recuperación del brazo tras un ACV

Un ensayo aleatorizado publicado en Nature Medicine halló que una plataforma que combina realidad virtual inmersiva con neuroestimulación sensorial sincrónica produjo mayor recuperación motora del brazo que la rehabilitación convencional en pacientes con ACV crónico. Los resultados abren la puerta a terapias más accesibles, incluso desde el hogar.

Leer más →

Temas relacionados