: BLOG DEL MÁSTER EN BIG DATA Y DATA SCIENCE ONLINE DE LA UNED; 21 Octubre 2020; Visto: 2379

BIG DATA Y MACHINE LEARNING

Ninguna organización o empresa seria del momento debería apartar los datos de su política organizativa, si lo que pretende es crecer y mejorar sus procesos productivos. Sin embargo, la cuestión ya no está en el plano de concienciación a nivel de dirección, ahora hace falta una estrategia trazada sobre inteligencia artificial y Machine Learning, coherente con los objetivos productivos o comerciales.

En las primeras ediciones del Máster en Big Data y Data Science de la UNED, uno de los argumentos esgrimidos en vídeos destinados a difusión fue: Todo lo que nos rodea son datos… Los datos son la riqueza. Big Data es la nueva industria.

Poco tiempo después constatamos que nuestra existencia transcurre, como un fogonazo a la velocidad de la luz, entre los 41 millones de mensajes vía Whatsapp o las casi 1.400.000 llamadas que circulan cada minuto por la red, entre otros aluviones parecidos. La necesidad de gestionar y extraer valor de toda esa información se traduce en necesidad: se habla de toda clase de combinaciones profesionales llegadas desde empresas y Administraciones, que no hayan suficiente respuesta en el mercado laboral. Llama la atención, por ejemplo, la paulatina consolidación de una demanda alrededor de Big Data y Machine Learning; conocimiento para analizar grandes volúmenes de datos más la capacidad de articular soluciones tecnológicas innovadoras.

Partamos del hecho conocido de que el aprendizaje automático está unido a uno de los ámbitos más prometedores de los últimos años: la inteligencia artificial. Los estudiosos de este campo programan algoritmos que parecen coincidir en una tarea sencilla; claro, en este caso, sencillez quiere decir revolucionarios pasos de gigante: el algoritmo puede identificar patrones en grandes matrices de datos. Cuando pasan ciertos umbrales, además, logran hacer predicciones. Si la programación ha sido la adecuada, este aprendizaje llega a realizarse autónomamente.

Por supuesto, hablamos de un paradigma ya bastante “antiguo” en escalas tecnológicas. La diferencia entre las teorizaciones que empezaron a aparecer al respecto en los años 50 del siglo XX y la época actual no es otra que la cantidad de datos, el Big Data y el Data Science.

Pero el otro rasgo que llama nuestra atención es el grado de penetración que este tipo de soluciones tiene ya en la vida cotidiana. Aplicaciones Machine Learning se están utilizando para indagar en temas centrales como la ocupación en las redes de transporte público o la conexión que existe entre hábitos de vida (como el ejercicio, la dieta, etc.), los accidentes cardiovasculares y las necesidades de inversión en los sistemas sanitarios. En ambos casos, pueden construirse análisis personalizados.

En un momento donde crece en todas partes la preocupación por la administración eficiente de los recursos, la sostenibilidad, etc. contar con equipos enfocados al trabajo con datos pasó a convertirse en el auténtico factor diferencial. Asistimos, inclusive, a la imagen de grandes compañías en industrias de lo más disímiles, como la del entretenimiento, que por su utilización de la información pasan a revelarse como empresas de datos.

Entre las grandes tecnológicas, es la carrera por la explotación de los datos y la profundidad de sus ideas sobre analítica masiva lo que configura gran parte de la realidad sociocultural que podemos observar. Parece claro que el almacenaje y procesado de los datos es algo asumido por todos, pero entre los terrenos donde se dan las batallas últimas tenemos el Machine Learning: cuantos más datos terminan por alimentar un sistema más aprende éste y mayor cantidad de certezas estadísticas e información lógica podrá arrojar a quienes toman decisiones.

Es decir, el aprendizaje automático es una “metodología” estratégica cuando la estructura emprende el estudio de la información que ha logrado recolectar a partir de todas sus actividades. En sentido de lo anterior, por ejemplo, la categorización de los datos, la diferenciación de pautas y la estructuración de una conjetura lógica puede llegar a ser la distancia entre existo o fracaso en múltiples proyectos industriales, desde trabajos de explotación energética hasta grandes decisiones comerciales.

Entre las grandes ventajas del Machine Learning está que puede implementarse a cualquier altura de las operaciones características del Big Data: segmentación, etiquetado, análisis, simulación, etc. Se trata de algoritmos extraordinariamente útiles en la recopilación, el estudio y la integración de los datos.

SECTORES CON MUCHA PRESENCIA DE MACHINE LEARNING

El tipo de proyectos donde parece estar más integrado el Machine Learning, en todo el mundo, pasa por estudios de mercado y segmentación: aquí tenemos una de las piedras angulares, nada menos y nada más que la definición del público objetivo. Este no es un sector menor, dado que es donde la tecnología se encuentra con la voluble subjetividad que nos caracteriza. En la industria del entretenimiento, en los medios de noticias, etc. tiene mucho valor la búsqueda de patrones en la propia conducta del usuario y consumidor de contenidos.

Lo anterior, a su vez, se relaciona con la creación de modelos sobre el comportamiento de clientes. Lo denominado como modelado de usuarios tiene una de sus fuentes más importantes en las redes sociales, permitiendo (mediante el sistema de sugerencias) influir significativamente en la orientación del consumo.

Al hilo de lo anterior, los algoritmos de Machine Learning permiten algo impensable hace algunos años: personalizar al máximo un sistema de “recomendaciones”, en teoría, adaptadas a la conducta del sujeto. A partir de aquí, como podemos suponer, el problema de la predicción acerca de futuras tendencias se reduce significativamente. La predicción no es otra cosa que construir una imagen de un futuro en base al aprendizaje acumulado, cuando esto se estructura sobre redes computacionales que pueden aprender continuamente sobre sus propias operaciones y las tareas que tienen encomendadas, esa especie de “futuro sorpresa” que da al traste con cualquier perspectiva comienza a perder importancia.

Finalmente, al descifrar todos estos patrones codificados en los datos, lo que buscamos es reducir, precisamente, el peso del impulso subjetivo en la toma de decisiones. Así que no hablamos de otra cosa que del viejo sueño racional donde el orden logra sobreponerse al caos.