Personal científico de la Fundación para el Fomento de la Investigación Sanitaria y Biomédica de la Comunidad Valenciana (Fisabio), en colaboración con la Society for Imaging Informatics in Medicine (SIIM), ha convocado un 'challenge' o desafío científico a nivel internacional para la detección de covid-19 en radiografías de tórax a través de Inteligencia Artificial (IA).
El desafío científico se realizará en 'Kaggle', una plataforma de aprendizaje automático o 'Machine Learning' que reúne a cientos de miles de personas expertas en desafíos de toda índole, a nivel mundial, basados en ciencia de datos.
El proyecto, más conocido como 'BIMCV-COVID-19', se inspiró en el proyecto 'PADCHEST' de la doctora Aurelia Bustos y fue seleccionado y financiado por la Conselleria de Innovación, Universidades, Ciencia y Sociedad Digital en la 'Llamada al Sistema Valenciano de Innovación e Investigación', en colaboración con la Consejería de Sanidad Universal y Salud Pública, que autorizó el proyecto desde sus inicios.
Asimismo, el trabajo ha sido valorado "positivamente" por muchos laboratorios a nivel mundial. El desafío se convocará próximamente a nivel mundial para que participen científicos de todos los países y aporten "todo su talento" en esta causa.
Los científicos han recopilado datos de radiografías torácicas de pacientes de la Comunidad Valenciana para generar modelos predictivos que utilicen la IA. Estos modelos son supervisados por radiólogos especialistas con el fin de detectar de forma temprana la neumonía por covid-19 en pacientes con síntomas leves.
Igualmente, permite ayudar a la estratificación del riesgo de pacientes con síntomas moderados y ayudar a identificar a pacientes con mayor riesgo de evolución a una condición grave o crítica. Los datos son totalmente anónimos y la información recabada hace referencia únicamente a aspectos clínicos.
El objetivo es generar un conjunto de datos en abierto (dataset OPEN) reconocido a nivel mundial como uno de los datasets "más completos y organizados", que permita a los científicos de datos trabajar en desarrollos de algoritmos de Inteligencia Artificial para elaborar modelos predictivos y desarrollar herramientas orientadas al diagnóstico simple, rápido y efectivo del coronavirus. Asimismo, pretende ayudar a agilizar la carga de trabajo de los profesionales sanitarios.
Actualmente se han compartido más de 12.456 sesiones de radiografías de tórax pertenecientes a unos 4.706 sujetos con patología covid. Además, se cuenta con más de 6.012 sesiones de radiografías pertenecientes a unos 4.437 pacientes sanos o con distintas patologías provenientes de los sistemas de información sanitarios de la Consejería de Sanidad Universal y Salud Pública, que serán la base con la que se iniciará este desafío científico.
La respuesta ha sido "muy positiva", con descargas desde todos los continentes y con un "amplio" reconocimiento a nivel mundial. Para ello, ha sido fundamental la colaboración del Centro de Investigación Príncipe Felipe (CIPF) y del Barcelona Supercomputer Center (BSC-CNS) que ha proporcionado una instancia de B2DROP para la distribución de este trabajo. B2DROP es parte de los servicios de infraestructura de datos colaborativos de EUDAT (www.eudat.eu).
En este momento, el equipo de radiólogos del Hospital San Juan de Alicante, liderado por su jefe de servicio, el doctor Joaquín Galán, junto con la doctora Aurelia Bustos, realizan un etiquetado previo necesario para preparar los datos de modo que los científicos puedan realizar buenos modelos predictivos.
En la construcción del dataset 'BIMCV-COVID-19' se han tenido en cuenta los cuatro principios fundamentales FAIR para el manejo de datos científicos: capacidad de búsqueda, accesibilidad, interoperabilidad y reutilización.
En esta línea, la intención del equipo investigador es que los principios se apliquen no solo a los datos en el sentido convencional, sino también a los algoritmos, herramientas y flujos de trabajo. La aplicación de estos principios a todas las fases del proceso de investigación garantiza la transparencia, la reproducibilidad y la reutilización.
Por último, se va a incorporar este dataset como un nuevo caso de uso para la evaluación de las librerías europeas (EDDL & ECVL) que se desarrollan dentro del marco del proyecto Europeo DeepHealth.