ESTO ES DATA SCIENCE…

La ciencia de los datos como disciplina académica y necesidad empresarial demanda mayores inversiones en tecnología y formación superior. El Data Science es uno de los enfoques multidisciplinares más complejos, cobrando importancia en prácticamente todas las dimensiones de la vida social y cultural. La realidad analógica está siendo duplicada en digital. Extraer conocimiento útil de los datos se convierte en estratégico ante la actual incertidumbre económica. 

Un sujeto medio del Norte del mundo tiene interacciones con tecnología desde que abre los ojos por la mañana hasta que los cierra al anochecer. Sobre sus acciones cotidianas existe una especie de realidad súper-estructural formada por algoritmos, éstos se alimentan de los datos que generan todas sus acciones.

Para empezar, sus dispositivos móviles pueden hacer una estimación de horas de sueño, en base a sus alarmas programadas. Es probable que, tras levantarse y tomar el primer café, entre a Internet y haga distintas consultas: noticias, correo electrónico, redes sociales, etc. La geolocalización puede decir cuáles son sus trayectos, sus estaciones y el tiempo que permanece en ellas: el trabajo, el gimnasio, el parque, un centro comercial, su casa, etc.

Incluso, puede generarse un registro con el número de veces que consultamos el móvil o la tablet y qué aplicaciones son encendidas.  Todas y cada una de las acciones anteriores se convierten en datos. Resulta meridianamente claro que, si un usuario joven activa la pantalla de su teléfono móvil entre 80 y 90 veces al día y consulta un promedio de 60 mensajes en redes sociales durante esas 24 horas, la recreación de un mapa con la cronología de tal interactividad puede dar ciertas pistas sobre los momentos en que un determinado mensaje (por ejemplo, acerca de un consumo X) podría dar un resultado cercano al óptimo.

Parece ser un hecho que la realidad analógica está siendo duplicada en digital. Esto permite una acción de procesado e interpretación que casi se toca con lo filosófico (estamos ante la respuesta a la pregunta que no sabíamos que estaba ahí), abriendo un debate de hondo calado sobre cómo mejorar el mundo donde vivimos mediante la utilización de esos grandes volúmenes de datos.

Lo otro que parece estar claro es el valor de los datos para las ciencias sociales. Por ejemplo, las 40 mil búsquedas al segundo en Google, las más de 300 horas de vídeo que diariamente se suben a YouTube, los más de 12 Terabytes diarios de tuits o los más de mil millones de comentarios diarios publicados en Facebook podrían alimentar una radiografía o lectura en tiempo real extremadamente interesante sobre la sociedad actual. Así, pues, el Data Science se convierte en un aliado estratégico de disciplinas como la Sociología, la Psicología, la Comunicación o las Ciencias Políticas. 

Todas estas cuestiones nos llevan a una afirmación ya algo trillada, pero cada día más cierta: el Data Science es uno de esos perfiles que puede elegir dónde quiere trabajar. Algunas previsiones (como la de Social Point) estiman que la demanda en los próximos años pasará de los 4 millones de profesionales en todo el mundo. 

Por supuesto, los científicos de datos se valen de infraestructuras adecuadas a sus necesidades. En los círculos de élite de este campo, encontramos proyectos de investigación que utilizan los grandes centros de computación. El Centro de Supercomputación de Barcelona, por ejemplo, con 10.240 procesadores que unen su potencia para resolver el mismo problema, a un rendimiento de 63, 83 tera-flops (billones de operaciones por segundo), se utiliza en predicciones sobre el cambio climático, en simulaciones sobre la actuación de fármacos en distintas patologías (modelos sobre 500 tipos de cáncer), entre otros.

La ciencia de datos estima que otros grandes retos, como la política alimentaria o la eficiencia energética requieren millones de procesadores trabajando conjuntamente. Esto se conecta con lo que la prensa especializada ya define como una de las grandes batallas de este siglo: quién, cómo y cuándo puede utilizar toda esa riqueza sin refinar que se guarda en los data center, aquellos universos ultra protegidos que el gran público capta simplemente como la “nube”.    

DATA SCIENCE Y EL ENFOQUE MULTIDISCIPLINAR

La difusión del Data Science como disciplina académica en las sociedades europeas y de habla hispana ya figura en la agenda oficial de varias Administraciones. Nos referimos a un ámbito donde se combinan elementos de Estadística, matemáticas, programación y otros. La ciencia de los datos utiliza procedimientos científicos para extraer conocimiento de información bruta. Así, una de las finalidades de contar con un científico de datos en los equipos empresariales es la anticipación de escenarios que den mayor sustento racional a la toma de decisiones.

De esta manera, una formación superior enfocada al análisis de datos permite, precisamente, desvelar esa lógica subyacente en un gran cúmulo de datos, cuya interpretación permite acciones hoy consideradas neurálgicas, como el ahorro de recursos, la maximización, el logro de objetivos o administración inteligente de los procesos productivos.  

Una de las razones de este notable éxito del Data Science está en las materias concretas que componen a este cuadro profesional. En este sentido, tenemos:

  • Data Mining, extrayendo y almacenando datos útiles
  • Deep Learning, redes neuronales que pueden resolver problemas.
  • Machine Learning, la máquina que aprende y corrige errores.
  • Inteligencia Artificial, en un futuro que ya está aquí.

Por supuesto, una vez la sociedad tiene claridad sobre la importancia de los datos y las figuras profesionales ligadas a ellos, es clave centrar el debate. Podemos contar con que la tecnología seguirá avanzando, en unos casos generando toda clase de discusiones y contradicciones y en otros aportando soluciones a problemas sociales.

El año 2021 se perfila como uno de los más complejos de los últimos tiempos. Entramos en una etapa donde todas las escalas de la economía deben apostar fuerte por la tecnología, la digitalización y la inversión en formación superior. Sobre todo pensando en sectores con alto valor añadido. Con solo un 24% de estudiantes que optan por formación universitaria en ámbitos tecnológicos, España no logrará enfrentar la amenaza del desempleo y la recesión, entre otras.   

Toda estrategia como sociedad que no contemple a la ciencia de datos nos pondrá en desventaja, en unos momentos donde debemos aprender a utilizar la información a nuestro alcance mejor que nunca.


Máster en Big Data y Data Science de la UNED: MATRÍCULA ABIERTA