Máster en Big Data y Data Science de la UNED

Uno de los grandes desafíos técnicos de nuestro momento histórico es cómo gestionar la ingente cantidad de información que producimos día a día. La intervención de la analítica de datos para unir la necesidad real con las habilidades y competencias disponibles en un entorno social o el objetivo de comprender y calcular con rapidez aquellas variables que estructuran las grandes obras de ingeniería, la administración de los recursos de la economía, etc. es ahora fundamental. Big Data y Data Science son hoy prácticamente cuestiones de Estado.

La complejidad de la analítica masiva permite, entre otras cosas, extraer un conocimiento técnico sobre la realidad humana con infinitas aplicaciones, encontrar respuestas para interrogantes viejos, emergentes o que ni siquiera sabíamos que estaban ahí.

Así, durante la última década hemos visto la irrupción de un paradigma tecnológico de valor global creciente, cuya explosión estuvo relacionada con los cambios en el almacenamiento de la información. Antes de que la nube permitiera guardar todo el volumen de datos de una compañía, era necesario discriminar por los costes económicos del almacenamiento; esto fue algo experimentado por grandes como Amazon o Adobe. Sin embargo, son los gigantes tecnológicos quienes fueron a la vanguardia de soluciones en la nube que actualmente permiten conservar grandes matrices de datos para someterlas a múltiples análisis e interpretaciones.

Hecho lo anterior, el problema pasó a ser otro: ¿Dónde estaba la aguja en el pajar? ¿Cuáles son las preguntas correctas?

Por supuesto, cuando los volúmenes de datos a los que se enfrenta un equipo de análisis adquieren cierta relevancia y tienen determinados orígenes, todo pasa a convertirse en estrategia e incluso interés geopolítico. Fue lo que le ocurrió a Rayid Ghani (director del Centro para la Ciencia de los Datos y las Políticas Públicas de la Universidad de Chicago) cuando actuó como jefe científico en la segunda campaña de Obama para la Casa Blanca. Tuvo que trabajar con un auténticamente ignoto océano de datos, de los que buscaba extraer bloques con valor relevante.

El equipo de Ghani tenía al frente unos interrogantes muy simples que debían ser planteados al censo electoral del país (a los datos): ¿El dueño de cada uno de esos registros acudiría a votar? ¿Lo haría por el candidato del Partido Demócrata? Ahora bien, en este caso hablamos de dos preguntas, en efecto, simples, pero extremadamente consolidadas. Cada una de ellas representaba o sintetizaba un árbol de decisiones densamente ramificado, en el origen había elementos aportados por los expertos e investigadores en Psicología Política y Comunicación, por ejemplo. Éstos proporcionan claves sobre la subjetividad presente en la conducta política que, a su vez, podrían traducirse en ciertas pautas (de consumo de contenidos o comportamiento en las redes sociales, entre otras). Esas pautas son buscadas por los analistas en datos con distinto volumen durante la preparación de las campañas políticas. ¿Con qué fin? Entre una gran variedad de objetivos, se busca identificar los anclajes culturales y sistemas de creencias que dirán al equipo de comunicación cómo estructurar y segmentar un mensaje capaz de ganar elecciones. Nos referimos a la gran cuestión de cómo “detonar” el voto, como argumentan los expertos en Psicología y Comunicación Política.

Ghani y sus colaboradores usaron, entre variedad de soluciones, sistemas de puntuación para descartar los extremos (la total seguridad del voto favorable y la casi seguridad del voto contrario); lo que les permitió enfocar sus recursos más importantes en las lecturas intermedias, a la vez que dirigieron un mensaje específico de movilización al votante favorable (para reforzar las redes de difusión, de voluntarios, donantes, etc.).

Naturalmente, las conclusiones de este tipo de proyectos en Big Data necesitan ser comparadas con las obtenidas en los ejercicios anteriores, es decir, en las citas electorales pasadas. Esto último va a permitir detectar errores en los planteamientos, los interrogantes, los algoritmos, etc.; pero también mostrará la evolución de la opinión pública frente a la política y el resultado de la gestión.

Como es bien conocido, este nuevo paradigma tecnológico apunta a una trascendencia mucho mas amplia. Existen aplicaciones del Big Data al trazado de políticas de empleo, lucha contra la pobreza, salud, educación, transportes, agricultura, generación de energía, cambio climático, etc. En suma, el Big Data y el Data Science son necesarios para que los Gobiernos actuales desarrollen adecuadamente sus competencias. El centro de este debate fundamental de nuestra época es muy sencillo: sin analítica de datos no tendremos un criterio racional, científico y justo sobre cómo, cuándo y dónde emplear los recursos económicos con lo que un país cuenta.

BIG DATA Y SMART DATA PARA UN MEJOR GOBIERNO

El mundo de la Administración pública es tremendamente enrevesado, sin la existencia de plataformas Big Data los Gobiernos centrales y locales no pueden saber si los recursos empleados, por ejemplo, en el tratamiento de residuos, transporte, seguridad o la red de asistencia médica, cuentan con un reparto acorde con las necesidades que marca la distribución de la población. En este sentido, las instituciones suelen enfrentarse a los mismos problemas: la lentitud en la asimilación e integración de nuevos paradigmas tecnológicos y la falta de profesionales con la formación superior necesaria.

Desde luego, hace falta una política enfocada a la incorporación a la Administración de los expertos y especialistas en Big Data y Data Science que están formándose ahora; sobre todo en las universidades públicas, donde sobresalen algunos programas por su calidad y nivel de preparación del cuerpo docente.

Aunque contemos con las mayores garantías democráticas, el Estado siempre funciona con ciertas dosis de inercia y apego a lo anterior, a lo viejo y conocido. Esto es parte de esa típica racionalidad occidental con amor por la estabilidad y el orden que teóricamente aporta lo comprobado desde antiguo. El problema es que nos encontramos ante una continua crisis de sostenibilidad que hace mucho se ha convertido en sistémica. Al preguntarnos por lo que los datos pueden aportar para mejorar las condiciones de vida de la sociedad (sujetos, organizaciones, empresas, instituciones, etc.) no valen los métodos habituales.

Así, pues, el Big Data no se lleva bien con los prismas tradicionales. Llegar hasta el Smart Data, la información realmente importante, capaz de estructurar un relato e interpretación acerca de una parcela de la realidad, demanda una visión fresca, creativa y avanzada. Llegar hasta ese dato estructurado sensible a los algoritmos y aplicaciones, requiere formación y talento. Porque no debemos confundirnos con esto, esos algoritmos matemáticos que pueden desafiar a los datos, el machine learning que tolera el mejoramiento de la tarea es conocimiento y talento aplicado. Hablamos de dos atributos al alcance de todos aquellos dispuestos a aceptar el esfuerzo y los retos de este tiempo.