Un nuevo modelo de inteligencia artificial, llamado Delphi-2M, ha demostrado ser capaz de predecir con gran precisión el avance y el riesgo de más de 1.000 enfermedades al mismo tiempo, basándose en el historial de salud de un individuo. Esta herramienta podría transformar la medicina de precisión, permitiendo a los médicos anticipar riesgos de salud y planificar mejor los tratamientos.
Un equipo de investigadores modificó la arquitectura GPT (transformador generativo pre-entrenado), similar a la que utilizan los grandes modelos de lenguaje (LLM), para crear Delphi-2M. El modelo fue entrenado con los registros médicos de 0,4 millones de participantes del Biobanco del Reino Unido , y validado con datos externos de 1,9 millones de individuos daneses sin necesidad de ajustes.

Una de las características más prometedoras de Delphi-2M es su naturaleza generativa, que le permite simular trayectorias de salud futuras y estimar la posible carga de enfermedades hasta por 20 años. Esto lo hace una herramienta invaluable para la planificación a largo plazo en el sistema de salud. El modelo supera en rendimiento a los modelos de riesgo actuales para enfermedades individuales, y ofrece la ventaja de evaluar más de 1.000 enfermedades simultáneamente, superando a otros modelos multienfermedad en calidad.
Además, el modelo ofrece información sobre cómo las afecciones previas influyen en la aparición de futuras enfermedades y puede identificar la conexión entre distintas comorbilidades. Esto ayuda a comprender la interdependencia temporal entre los eventos de salud, algo que los modelos epidemiológicos convencionales tienen dificultad para cuantificar.
A pesar de sus grandes ventajas, el estudio también destacó que el modelo aprendió sesgos inherentes a los datos de entrenamiento. Por ejemplo, se observó que la precisión de las predicciones era ligeramente menor cuando se aplicaba a los datos daneses, lo que resalta la existencia de diferencias entre los sistemas de salud de los países. Los investigadores también notaron que los datos del Biobanco del Reino Unido tienen sesgos de selección, como la falta de registros de muertes antes de los 40 años, lo que afecta la capacidad de Delphi-2M para modelar la mortalidad a edades más tempranas.