Especialistas en Big Data y Data Science contra la pandemia

Aplicaciones de auto-diagnóstico y los datos de movilidad están siendo necesarios, junto a las técnicas manuales, para luchar contra las cadenas de contagio. Se presenta una alianza estratégica entre Epidemiología y ciencia de datos. Europa prepara soluciones tecnológicas comunes en el marco de la red sanitaria digital. Se demanda un esfuerzo mayor en formación e investigación para que los datos nos ayuden a proteger a la sociedad.

Durante los días más complicados de la pandemia, cuando los datos todavía se presentaban confusos, llegaron algunas iniciativas alrededor de aplicaciones de auto-diagnóstico. En Asia estas aplicaciones ya habían mostrado cierta eficacia para controlar la cadena de contagios. En el caso español, hubo esfuerzos en ese sentido dentro de varias Comunidades Autónomas.

Al principio se pretendió lograr una herramienta plástica y versátil que ayudara en la descongestión de los centros de información. Pero los científicos de datos que estaban detrás, sabían bien que tales aplicaciones podrían rellenar los varios agujeros que tenían las matrices de información que este terrible proceso estaba generando.

Naturalmente, el debate surgido, en torno a cuestiones como el fin público, la privacidad, etc., tiene como respuesta a la propia emergencia sanitaria. Estábamos viendo a científicos que mostraban el potencial, precisamente, de los datos o la inteligencia artificial para la protección de la sociedad.

Muy pronto los medios recuperan diversa información sobre cómo los datos derivados de las redes de telefonía móvil eran, por ahora, una de las más importantes bases para ganar la carrera de la vida en situación de pandemia. Expertos y voces calificadas, incluso desde la prensa científica, llamaron la atención acerca de la necesidad, ahora más que nunca, de basar las decisiones estratégicas en el análisis inteligente de datos agregados y anonimizados. 

En efecto, toda esa realidad intangible codificada en los datos nos permitiría comprender el fenómeno a una profundidad nueva. Los estudios realizados en base a la movilidad permitieron, en varios lugares del mundo, generar mapas y patrones donde observar la propagación del virus  (la propagación es un reflejo de la movilidad de los humanos).

A partir de lo anterior, se vinieron a construir modelos matemáticos que intentan aportar una de las piedras angulares de la investigación científica: la predicción, que impartiría un conocimiento basado en evidencias. Es esto, ninguna otra cosa, la clave para adelantarse a las conductas humanas que emprenden o hacen parte de la cadena de contagio. Las simulaciones creadas con modelos matemáticos, además, tienen la ventaja de ilustrar varios escenarios; algo fundamental en sociedades donde los factores culturales no permiten pensar en una sola dimensión de la movilidad.

En suma, lo que fue evidente es que las aplicaciones de auto-diagnóstico, los datos enviados por los propios ciudadanos (vía encuesta digital, por ejemplo) como los datos recogidos desde la red de telefonía móvil, han sido claves para la coherencia de ese volumen de datos que podría ayudar a explicar la imagen cambiante de la pandemia.

La discusión sobre la utilización de aplicaciones móviles que estructuraran sistemas de alertas individuales, en base a soluciones que trabajan sobre grandes volúmenes de datos, ha sido amplia y complicada desde los inicios de la crisis. Hay, claramente, dos modelos enfrentados: el asiático, donde estas soluciones tecnológicas se han utilizado con gran profundidad, y el europeo, donde junto al temor al contagio, existe una cultura de la privacidad y una legislación muy desarrollada en esa dirección (el Reglamento General de Protección de Datos - RGPD).

EPIDEMIOLOGÍA Y CIENCIA DE DATOS

Se plantea un problema ya conocido: la geolocalización, evidentemente, no iba a ayudarnos demasiado si no se cruzaba en tiempo real con la evolución epidemiológica y la cesión de muchísima información personal.  Estamos ante un debate muy lejos de resolverse.

Entre tanto, cuando la desescalada está bastante avanzada, incluso los científicos de datos se afirman en la posibilidad de un rebrote; dado que esencialmente no se han modificado factores sensibles como ausencia de vacuna, fortaleza del sistema sanitario o inmunidad comunitaria. Ante esto, una nueva pedagogía sobre la utilización de los datos en la detección temprana, por ejemplo, podría ser la diferencia en la segunda ola del Covid-19 o en futuras pandemias. Ya que esa detección permitiría romper cadenas de contagio antes de que éstas empiecen.

¿Qué asusta en estos momentos a los científicos de datos? Los modelos que hablan de crecimientos exponenciales. Para combatirlos, la ciencia de datos propone una alianza de Big Data y Data Science con ya antiguas técnicas epidemiológicas, en base a lo que entendemos por rastreo de casos. Es en ese momento donde los datos y las herramientas digitales otorgan mayor fidelidad a la información de origen y tratamiento estrictamente humano.

Como es conocido por un gran sector de la opinión, algunos gigantes tecnológicos (Google, entre ellos) ya tienen avanzados sus proyectos para la creación de las herramientas tecnológicas que requieren del esfuerzo entre Epidemiología y análisis de datos. Los expertos, Martín Varsavsky entre ellos, llaman la atención sobre cierta guerra de aplicaciones y herramientas digitales desarrolladas para el apoyo a la detección temprana y el rastreo de contagios, así como en la creación de las propias pruebas PCR y de anticuerpos. Es decir, para los científicos, una de las cabezas de preocupación, es la calidad de los datos que puedan conseguir. 

UNA RESPUESTA EUROPEA

Desde que empezó toda esta crisis, los Estados miembros de la Unión Europea han dado respuestas algo dispares en relación a la creación de aplicaciones móviles que apoyaran en el rastreo. Pero a mediados de junio de este 2020, con el liderazgo de la Comisión Europea, la Unión llega a un acuerdo sobre un modelo de especificaciones técnicas que persigue la estabilidad y seguridad en el intercambio permanente de información sobre el contagio.

El esquema anterior hará parte de la red de sanidad electrónica. Recordemos que, desde el 2019, los ciudadanos pueden acceder a sus historiales médicos electrónicos desde cualquier Estado miembro. Para el 2021 se espera que exista una infraestructura de servicios digitales sobre sanidad electrónica a nivel europeo.

En el marco de la desescalada y desde una propuesta de arquitectura descentralizada se busca que las herramientas móviles ofrezcan un flujo de datos continuo, con unas especificaciones comunes e incluso en desplazamientos entre países. Que tales aplicaciones funcionen de forma similar en cualquier lugar de la UE donde el usuario encienda el dispositivo, es decir, que actúen como si se tratase de desplazamientos locales, será fundamental durante el período estival que se aproxima.  

En sentido de lo anterior, Stella Kyriakides, comisaria de Salud y Seguridad Alimentaria de la UE, declaró en días pasados: “Las tecnologías digitales son cruciales para alertar a nuestros ciudadanos sobre los riesgos de infección y para romper las cadenas de transmisión cuando estamos reabriendo nuestras sociedades y economías. Insto a nuestros ciudadanos a que las utilicen, ya que estas tecnologías sólo pueden ser eficaces si tenemos una masa crítica de usuarios y existe interoperabilidad de las aplicaciones a través de las fronteras de la UE. La seguridad de los datos, los derechos fundamentales y la protección de la intimidad en estos instrumentos digitales no serán negociables.”

Uno de los pocos interrogantes despejados en esta dura crisis es que la ayuda de aplicaciones para dispositivos móviles es necesaria en los esfuerzos de rastreo manual. Existe cierta filosofía estructural, más o menos común, en esas aplicaciones, derivada de su arquitectura descentralizada: cada usuario tiene un identificador arbitrario guardado en el propio dispositivo, éste se coteja con otros identificadores almacenados que estuvieron dentro de cierto radio y durante un rango de tiempo. Entre esos identificadores estarán las marcas que indican positivo por coronavirus. 

Pero podríamos referirnos todavía a otra certeza: la ciencia de los datos está demostrando ser extraordinariamente fundamental en estas luchas. Sí, existen debates sin resolver en todo lo que tiene que ver con la privacidad, también falta una gran inversión en formación superior para que las Administraciones cuenten con los científicos de datos necesarios, como comentamos en una entrada anterior. Y, por supuesto, se demanda investigación, algo en lo que la academia tiene la mayor responsabilidad.

Programa Modular de Experto, Especialista y Máster en Big Data y Data Science de la UNED