Una investigación liderada por Elle Lett, PhD, y publicada en JAMA Network Open, demuestra que los modelos de predicción que consideran las identidades múltiples de los pacientes, como la intersección de raza y género, son significativamente más equitativos y seguros para todos.

El dilema de la inteligencia artificial en la sala de urgencias

La inteligencia artificial (IA) se está integrando cada vez más en entornos críticos de atención médica, como los departamentos de emergencias (ED). Estos sofisticados algoritmos prometen revolucionar la medicina al predecir qué pacientes tienen más probabilidades de necesitar una admisión hospitalaria, ayudando a los médicos a gestionar el flujo de pacientes y a priorizar los recursos.

Sin embargo, esta poderosa herramienta conlleva un riesgo inherente: los modelos de IA aprenden de datos históricos que, a menudo, reflejan sesgos y desigualdades sociales preexistentes. Si no se diseñan y auditan con un enfoque en la equidad, estos algoritmos pueden perpetuar e incluso amplificar las disparidades en la atención médica, afectando desproporcionadamente a las poblaciones ya marginadas.

Justicia marginal vs. justicia interseccional: una diferencia crucial

Históricamente, los intentos de crear algoritmos «justos» han utilizado un enfoque llamado equidad «marginal». Este método evalúa la equidad para grupos demográficos de forma aislada; por ejemplo, se asegura de que un modelo funcione igual de bien para los hombres que para las mujeres, o para los pacientes blancos en comparación con los pacientes negros. Sin embargo, este enfoque simplista ignora que la identidad de una persona es compleja y multidimensional.

El estudio «Desviación Interseccional y Marginal en Modelos de Predicción para Admisiones de Emergencia», liderado por Elle Lett, PhD, y su equipo, argumenta que es necesario un enfoque de «desviación interseccional». Este método reconoce que las experiencias y los riesgos para la salud de, por ejemplo, una mujer hispana, no pueden entenderse simplemente combinando los datos de «mujeres» y «personas hispanas». Es la intersección de estas identidades la que crea un perfil de riesgo único que debe ser abordado directamente.

Un riguroso análisis en dos cohortes hospitalarias

Para evaluar la efectividad de este enfoque, la investigación se basó en un análisis retrospectivo de datos de dos entornos clínicos del mundo real. La primera cohorte provino del Medical Information Mart for Intensive Care IV (MIMIC-IV), una base de datos a gran escala que contiene información anonimizada de 160,016 visitas al departamento de emergencias de un centro médico para adultos en Boston.

La segunda cohorte, del Boston Children’s Hospital (BCH), aportó datos de 22,222 visitas pediátricas.

El uso de estas dos poblaciones distintas, una de adultos y otra de niños, permitió a los investigadores evaluar si los beneficios del enfoque interseccional eran consistentes en diferentes grupos de edad y contextos clínicos, fortaleciendo la validez de sus conclusiones.

Los modelos a prueba: regresión logística y bosques aleatorios

Para construir los modelos de predicción, se emplearon varias técnicas de aprendizaje automático estándar en la industria, incluyendo la regresión logística y los bosques aleatorios. Estos modelos fueron entrenados para predecir la probabilidad de una admisión hospitalaria basándose en la información inicial del paciente.

El rendimiento de cada modelo se evaluó utilizando métricas de precisión globales, como el área bajo la curva de características operativas del receptor (AUROC) y el área bajo la curva de precisión-recuperación (AUPRC). Estas métricas permiten medir la capacidad general de un modelo para distinguir entre pacientes que necesitarán ser admitidos y los que no, pero no informan sobre su equidad entre diferentes subgrupos.

Midiendo lo que importa: calibración y tasas de falsos negativos

El verdadero foco del estudio estuvo en las métricas de equidad. La primera fue el «error de calibración de subgrupos», que determina si las predicciones de riesgo del modelo son fiables para grupos específicos. Un modelo mal calibrado podría predecir un 20% de riesgo de admisión para un grupo cuando, en realidad, su riesgo es del 40%, lo que llevaría a decisiones clínicas erróneas.

La segunda, y quizás la más crítica desde el punto de vista de la seguridad del paciente, fue la «tasa de falsos negativos» (FNR).

Un falso negativo ocurre cuando el algoritmo predice que un paciente no necesita ser admitido, pero en realidad sí lo requiere. Una FNR elevada para un grupo interseccional específico significa que el sistema está fallando sistemáticamente a esas personas, enviándolas a casa cuando podrían necesitar atención urgente.

Resultados contundentes: el enfoque interseccional demuestra su superioridad

Los resultados del estudio fueron inequívocos. Al comparar los modelos optimizados con un enfoque interseccional frente a los que usaban un enfoque marginal, se observó una mejora significativa en la equidad. Específicamente, el método interseccional logró reducir los errores de calibración de los subgrupos en un rango del 5.7% al 11.1%.

Aún más importante, redujo la peligrosa tasa de falsos negativos en un 4.5% en general. Al examinar las cohortes de forma independiente, las mejoras fueron aún más pronunciadas en algunas áreas.

Lo más destacable es que estas mejoras sustanciales en la equidad se lograron sin comprometer la precisión general del modelo, medida por AUROC y AUPRC, demostrando que la justicia y el rendimiento no tienen por qué ser objetivos contrapuestos.

La trampa de la equidad aparente: crítica a los enfoques simplistas

El estudio emite una fuerte crítica a la dependencia excesiva de los enfoques de equidad marginal. Los autores advierten que estos métodos pueden conducir a una forma de «manipulación de la equidad» o «fairness gerrymandering».

Esto significa que un modelo puede ser ajustado para parecer justo en promedio para grandes grupos demográficos (por ejemplo, hombres vs. mujeres), mientras que, al mismo tiempo, oculta un rendimiento deficiente y peligroso para subgrupos interseccionales más pequeños (por ejemplo, mujeres negras o hombres asiáticos).

En esencia, el enfoque marginal puede dar una falsa sensación de seguridad, enmascarando los sesgos más profundos y dañinos del sistema.

Hacia una nueva generación de algoritmos médicos éticos

Las implicaciones de esta investigación son profundas y van más allá del ámbito académico. Los hallazgos abogan por la integración de la desviación interseccional como un paso estándar y obligatorio en el ciclo de vida del desarrollo y la auditoría de cualquier modelo de predicción clínica.

Se subraya la necesidad de que los desarrolladores de IA, los médicos y los reguladores miren más allá de las métricas de precisión generales y se centren en cómo funcionan estas herramientas para las comunidades más vulnerables.

El estudio también sugiere futuras líneas de investigación, como la exploración de atributos interseccionales adicionales (por ejemplo, estatus socioeconómico o idioma) y la validación de estos métodos en conjuntos de datos más grandes y diversos para garantizar una aplicabilidad más amplia.

Conclusión

La investigación aboga por un cambio de paradigma en el desarrollo de la IA para la salud. Al adoptar un enfoque interseccional, es posible construir modelos de predicción que no solo son más precisos, sino también significativamente más justos para los subgrupos más vulnerables.

Este método representa un paso crucial para mitigar activamente las disparidades en salud y garantizar que los avances tecnológicos beneficien a toda la sociedad de manera verdaderamente equitativa y segura.

Referencias

Autor

El equipo de redactores de Sapue realizo esta historia, utilizando herramientas editoriales, de traducción e inteligencia artificial. El proceso de redacción contó con incidencia humana en cada etapa.