ACUMULACIÓN DE DATOS Y BIG DATA: LAS PREGUNTAS CORRECTAS
- BLOG DEL MÁSTER EN BIG DATA Y DATA SCIENCE ONLINE DE LA UNED
- Visto: 5213
Acumular datos es relativamente fácil, otra cuestión es saber para qué sirven. Empresas y organizaciones están ya embarcadas en el almacenamiento masivo de datos, pero todavía están a medio camino de usarlos en objetivos concretos o de forma útil.
Según varios análisis, una cascada de casi 4.000 GB se acumulan a lo largo de una jornada desde un automóvil con sus sistemas conectados a alguna red. En un avión de pasajeros de los más habituales, un Boeing de corto y medio alcance, alrededor de 10.000 sensores recogen información de lo más diversa: sistemas de los motores, temperatura, presión, vibración, electricidad, turbulencia, altitud, humedad, etc; cada vez que toca tierra tiene que ordenarse una ingente cantidad de datos para determinar si puede seguir volando o no.
En todos los ámbitos la acumulación de datos es un hecho. Pero aunque las voces autorizadas insistan en que son una gran fuente de riqueza en sí mismos, su potencial depende de que sepamos cómo usarlos. Los datos son una materia bruta, se convierte en una mercancía valiosa y se le agrega valor continuamente solo cuando son procesados y analizados en una dirección o en otra.
De manera que vemos la necesidad de unir tres aspectos: tecnología, metodologías y visión estratégica. El procesamiento de los datos es sólo completamente útil cuando la organización o empresa tiene claridad acerca del lugar a donde quiere llegar. La ejecución de grandes proyectos en Big Data requiere antes la planificación sobre qué objetivos se persiguen en el entorno de la transformación digital y el análisis respecto a la conducta del usuario o el cliente para determinar el norte de la cadena de generación de valor.
Esta realidad se hace más compleja con innovaciones recientes como las reunidas en la definición “Internet de las cosas”, donde se observan fusiones de tecnologías que generan datos sobre el comportamiento. En este sentido, extraer pautas relevantes del análisis de los datos es, sobre todo, redireccionar los interrogantes a las cuestiones importantes. La simple acumulación sin antes plasmar las formulaciones correctas no permitirá la traducción de la información en valor.
Al estudiar las particularidades de un proceso productivo necesitamos saber qué elementos de su lógica interna estarán fuertemente reflejados en los datos acumulados. Esto, a su vez, guarda la respuesta a una seria de preguntas que, al principio, no están todavía expresadas. En el Big Data nos encontramos con la respuesta a distintos niveles de estructuración para preguntas sobre cómo mejorar la productividad que todavía no han sido planteadas de forma correcta. Así de simple al mismo tiempo que complejo.
La información puede maximizar y transformar un proceso de trabajo o una demanda social, pero requiere de unas dosis de “ingeniería creativa” que oriente cómo usar esa información. Si tenemos grandes bases de datos con claves sobre movilidad (lecturas horarias, velocidad, rutas, etc.) más estadísticas sobre medios de transporte, infraestructuras, clases de vehículos (como año de fabricación), tipos de combustible y rendimiento, etc. el conjunto sólo tendrá utilidad cuando la pregunta (es decir la necesidad) esté suficientemente clara: por ejemplo, qué tecnologías van a reducir o incluso detener la contaminación.
Evidentemente, la formulación de la pregunta adecuada es, casi siempre, un reflejo del deseo del sujeto-usuario. Ese deseo, como sabemos, puede ser dirigido por distintos poderes comunicacionales. Pero también en esto el Big Data y el Data Science son útiles: la magnitud de las bases de datos puede facilitar pero también dificultar la redirección. Aspectos como el machine learning o los modelos predictivos pueden ayudar a clarificar la respuesta a una de las preguntas angulares de la analítica de datos: ¿qué quiere realmente el sujeto, qué deseos están codificados en el océano de datos generados por sus procesos productivos o consumos culturales?
Y responder qué quiere ese sujeto es igual a decir: vamos a construir un modelo de predicción para adelantarnos a ciertas demandas.
¿Estamos afirmando que las herramientas y técnicas para “entender” los datos son algo más que un aspecto añadido del mundo cotidiano de la empresa y las organizaciones? ¿Qué hay cierta responsabilidad social?
En efecto, por que adelantarse a necesidades y demandas no es igual (aunque sea posible) que predecir reacciones a acciones concretas con objeto de manipular las preguntas-aún-no-formuladas pero cuya respuesta ya está "escondida" en los datos.
Por supuesto, el problema de la post-formulación correcta vuelve a poner el acento en el factor humano y la calidad de su formación.