Hablemos del Data Scientist

Los datos se han convertido en la base de una nueva industria. En el Data Scientist, aquel capaz de diseñar algoritmos que exploran las realidades digitales a un nivel desconocido, vemos al artífice de un capítulo nuevo en la historia del aparato de las ciencias, donde ningún problema del conocimiento puede prescindir de esa nueva profundidad que todos comentan. Hablemos del Data Scientist.

Un Data Scientist es la representación de una figura enigmática, el que puede navegar por los datos y encontrar cosas que no sabíamos que estaban ahí. Partamos de la siguiente idea: nuestros aparatos de ciencia pueden, en efecto, trazar una imagen extremadamente precisa de la materialidad que nos rodea. ¿Cómo? Pues a partir de la acumulación de las observaciones y experiencias suficientemente explicadas por un modelo teórico (con sus debidas implicaciones matemáticas, filosóficas, culturales, etc.).

Sin embargo, lo anterior dista mucho de ser un proceso sencillo o libre de dificultades e incluso retrocesos. Dado que esa revolucionaria forma de pensar que nos conduce por la hipótesis, la observación, experimentación y comprobación demanda algo que en sí mismo es un campo científico y cuyo auténtico desarrollo es espectacularmente reciente: el análisis de los datos.

Así es. Tras largas observaciones, a lo largo de años, podemos finalmente comprobar la existencia de un fenómeno de principio a fin: ciclos del clima, corrientes oceánicas, migraciones de especies, órbitas planetarias, etc. Sin embargo, ¿qué ocurriría si pudiéramos contar con datos que, aunque correspondan a una ventana de tiempo menor, cuenten con el volumen suficiente? Para empezar, podríamos implementar un análisis más inteligente, donde tales datos permitieran inferir las situaciones, cuerpos o factores necesarios para producirlos.

Efectivamente, unos datos pueden revelarnos la existencia de un rastro, una estela de unas características muy determinadas. Dicha pauta estaría codificada en los datos, en espera de ser revelada por el enfoque o los interrogantes correctos, con el fin de estructurar una argumentación que, de hecho, haga avanzar la comprobación científica. En suma, lo que aporta un análisis inteligente de los datos es información fiable de una naturaleza profundamente dialéctica, que puede desplegarse por fases.

DATA SCIENTIST

Hablamos de ciencia de los datos, que tiene entre sus atributos la posibilidad de regresar una y otra vez sobre las variables, persiguiendo la estructuración de una información cada vez más fiable. Parece existir algún consenso acerca de los rasgos generales de un Data Scientist:

  • Capacidad de abstracción.
  • Observación.
  • Retrospectiva.
  • Cierta intuición, entendida como plasticidad en el enfoque.

Ahora bien, cuando las anteriores facultades se potencian gracias a la “máquina” el conocimiento humano crece. Lo anterior es gracias a que nuestros sistemas de base electrónica pueden hacer correlaciones, encontrar y diferenciar patrones, delimitar y eliminar sesgos, emprender búsquedas, construir modelos, etc., todo esto a gran velocidad. La máquina impulsa la edificación de nuestros conocimientos.

Hablemos del Data Scientist

Al hilo de esto es útil pensar en la naturaleza, la sociedad humana o el propio Universo como redes formadas por grandes cúmulos de información. La actuación de la máquina, su misma simbolización, permite la existencia de la ciencia como la entendemos hoy. De hecho, el desarrollo desde el siglo XIX que llevó a considerar la Estadística como parte integrante de las Ciencias Sociales parece escenificarse nuevamente, en los espacios donde se debate la relación e importancia del análisis de datos en parcelas cada vez mayores de todo el aparato de las ciencias. Ya no podemos hablar de Conocimiento, con mayúscula, sin ciencia de los datos.

A partir de lo anterior, la imagen del Data Scientist hace su aparición cuando un problema científico pasa por estudiar unos datos que, por ejemplo, demandan el diseño o reinterpretación de algoritmos. Naturalmente, una tarea de esas características tiene varios niveles de complejidad, imponiendo círculos de habilidad y talento en la figura del Data Scientist. Es decir, un algoritmo puede diseñarse para ejecutarse en máquinas o redes computacionales de muy distinta potencia, en centros de supercomputación e incluso existen proyectos que exploran ya la conceptualización en torno a la computación cuántica.

En otras palabras, el Data Scientist es testimonio de una transformación digital que ha venido a modificar todos los ámbitos de nuestra existencia, es el campo del saber cuyo centro de interés son los datos, aquello que parece conformarlo todo en estos tiempos huérfanos de grandes relatos e intangibilidad.

El Data Scientist es una construcción, su existencia deriva de una especial formación superior y cierto entrenamiento, quizá con énfasis en aquellos grandes volúmenes de datos llegados desde las industrias energéticas, los servicios públicos, los transportes, la banca, los seguros o las conductas digitales. Se trata de sectores con los que tenemos una relación, digamos, directa, los alimentamos minuto a minuto con flujos de información. Cuando el Data Scientist entra en acción emprende un esfuerzo de ordenamiento para determinar el valor real de cada tramo de la información.

Cada sector de la producción está habitualmente interesado en cierto tipo de datos sobre sus usuarios. Sin embargo, un científico de datos puede extraer conocimiento en la pauta oculta que se aleja de una lectura ya instalada en una determinada cultura organizacional. Esto no resta importancia a otra de las capacidades del Data Scientist, consistente en la depuración.

En España existen múltiples empresas con intereses y proyectos en Data Science. El salario promedio de un Data Scientist, por ejemplo, en la ciudad de Madrid gira sobre los 35.000 euros al año (indeed), si bien aumenta de manera notable según se van adquiriendo años de experiencia y pasando a senior. La mayor parte de la oferta de puestos de trabajo están en la banca, las te lecomunicaciones, las consultorías estratégicas y los servicios tecnológicos.

 


Máster en Big Data y Data Science de la UNED: MATRÍCULA ABIERTA

7 RAZONES PARA ELEGIR EL MÁSTER EN BIG DATA Y DATA SCIENCE ONLINE DE LA UNED