Una herramienta basada en Inteligencia Artificial pronosticará la enfermedad en pacientes con COVID-19

04/08/20

El nuevo sistema de Inteligencia Artificial facilitará el pronóstico y la estimación de la evolución de pacientes con COVID-19

 

 

Investigadores de la Universitat Politècnica de València (UPV), junto con el Instituto de Investigación Sanitaria INCLIVA del Hospital Clínico Universitario de Valencia y el Instituto de Investigación del Hospital Universitario 12 de Octubre de Madrid i+12, trabajan en una nueva herramienta que ayudará a dar un pronóstico robusto para cada paciente con COVID-19 en el momento del ingreso. Se trata de un Sistema de Ayuda a la Decisión Clínica basado en técnicas de Inteligencia Artificial y aprendizaje automático. Combinando información sobre síntomas, comorbilidades y pruebas de laboratorio, permite obtener ese pronóstico personalizado para cada individuo y clasificarlo según el nivel de gravedad al que pudiera llegar –“por ejemplo, tras varios días puede sufrir una insuficiencia respiratoria aguda, para lo que un tratamiento precoz sería fundamental.

Uno de los principales desafíos para el aprendizaje automático en la COVID-19 es la calidad de los datos; reto al que esta herramienta del Biomedical Data Science Lab-ITACA de la UPV, ayudará a responder. Según explica Juan Miguel García-Gómez, coordinador del BDSLab-ITACA de la UPV, el aprendizaje automático tiene el potencial de ayudar en esta tarea mediante la aplicación de técnicas de aprendizaje no
supervisado y supervisado a los Registros de Salud Electrónicos (EHR) de los hospitales. Estas técnicas permiten extraer los patrones más significativos del historial de comorbilidad del paciente, los síntomas y las pruebas de laboratorio en el momento del ingreso, hasta sus últimos datos de la Unidad de Cuidados Intensivos (UCI), que pueden conducir a una estratificación temprana del paciente y a la predicción de su gravedad.

Sin embargo, hay fuertes evidencias de que los datos reales (real world data, RWD) contenidos en los Registros de Salud Electrónicos de los hospitales están lejos de ser perfectos, lo que limita su extracción de conocimiento tanto por los profesionales médicos como por las máquinas que pueden ayudar al diagnóstico del paciente. Además, la variabilidad inherente a la práctica clínica y la codificación de datos entre los hospitales, o incluso entre sus poblaciones destinatarias, puede sesgar cualquier resultado extraído de los
datos.

“Por lo tanto, los métodos aprendizaje automático y de Inteligencia Artificial (IA) requieren una evaluación y explicación de la Calidad de los Datos (DQ) asociada tanto al aprendizaje como a las nuevas predicciones para garantizar soluciones correctas y pragmáticas y esto es a lo que contribuye la metodología que hemos ideado, que será empleada por primera vez en esta herramienta”, apunta Carlos Sáez, investigador postdoctoral del BDSLab-ITACA de la Universitat Politècnica de València.

 

Carlos Sáez, investigador postdoctoral del BDSLab-ITACA de la Universitat Politècnica de València

Carlos Sáez, Investigador del BDSLab-ITACA de la Universitat Politècnica de València

 

Herramienta del Proyecto SUBCOVERWD-19 y seleccionado en Fondo SUPERA COVID-19

El equipo de la UPV, junto con expertos del Instituto de Investigación Sanitaria INCLIVA del Hospital Clínico Universitario de Valencia y del Instituto de Investigación del Hospital Universitario 12 de Octubre de Madrid i+12, trabajan en el desarrollo de esta herramienta en el Proyecto SUBCOVERWD-19, que permitirá disponer de una estratificación temprana del riesgo de gravedad-severidad del paciente en el momento del ingreso. La herramienta se basará en un modelo que combina aprendizaje no supervisado y supervisado. Además,
superará las limitaciones de la RWD para la investigación mediante un aprendizaje automático que tendrá en
cuenta la calidad y variabilidad de datos.

El Dr. Rafael Badenes, del Grupo de Investigación en Anestesia de INCLIVA, asegura que desde un punto de vista clínico, el contar con herramientas de inteligencia artificial que sean capaces de predecir, en fases tempranas de la enfermedad, cuál va a ser el devenir de la

misma, constituye un elemento crucial en la lucha contra la enfermedad. “En aquellos casos en los que se prevé mayor gravedad, podríamos instaurar tratamientos de manera más precoz, con el objetivo final de reducir la mortalidad y los ingresos en UCI», añade el Dr. Badenes, también jefe de sección de Anestesia del Hospital Clínico y Universitario de Valencia y profesor de la Universitat de València.

“La heterogeneidad y complejidad de la COVID19 hace imprescindible el uso de técnicas muy avanzadas y sofisticadas de análisis, para poder identificar los patrones clínicos y epidemiológicos todavía muy desconocidos en esta enfermedad. Creemos que este proyecto puede contribuir

a lograr este objetivo”, añade el Dr. Agustín Gómez de la Cámara, jefe de la Unidad de Investigación y Soporte Científico del Hospital 12 de Octubre.

Este proyecto, coordinado por el investigador de la UPV, Carlos Sáez, ha sido uno de los seleccionados en la convocatoria del FONDO SUPERA COVID-19, impulsada por Crue Universidades Españolas, Banco Santander, a través de Santander Universidades, y el Consejo Superior de Investigaciones Científicas (CSIC).

 

Variabilidad y calidad de datos

La falta de datos representativos de COVID-19 es una de las razones por las que se ha desaconsejado el uso clínico de modelos predictivos recientemente desarrollados para COVID-19, según un estudio publicado recientemente en el British Medical Journal.
“La calidad de los datos es crítica. Especialmente en los entornos de compartición de datos en múltiples sitios, la variabilidad entre las fuentes de datos es una posible fuente de sesgos inesperados en el aprendizaje de modelos y su posterior utilización”, apunta Carlos Sáez.

Con el fin de descubrir y clasificar los subgrupos de severidad de COVID-19 utilizando el conjunto de datos nCov2019, recientemente publicado en la revista Scientific Data, el equipo del BDSLab-Itaca de la UPV ha descubierto que los dos países con mayor prevalencia en tales datos (China y Filipinas) se dividieron en subgrupos separados con manifestaciones de gravedad distintas. “La variabilidad de las fuentes de datos puede conllevar potenciales sesgos para el proceso de aprendizaje automático de COVID-19, así como para la generalización de sus resultados en nuevos pacientes y localizaciones. Es crucial tener la variabilidad y calidad de datos en cuenta para una IA robusta y confiable.”, explica Carlos Sáez. Este trabajo y sus resultados se han recogido en la nueva herramienta COVID-19 Subgroup Discovery and Exploration Tool http://covid19sdetool.upv.es/

 

Con el apoyo de:

Logo AVI GVA