¿CÓMO SER CIENTÍFICO DE DATOS?

Ser un científico de datos es mucho más que trabajar en SQL o administrar bases de datos mediante distintas herramientas. No tenemos un criterio unificado sobre lo que es la ciencia de datos, aunque podemos decir unánimemente que nos referimos a un campo del conocimiento extraordinariamente requerido en todo el mundo. La impresionante demanda de expertos y profesionales en ciencia de datos redunda en remuneraciones que se encuentran entre las más ventajosas e interesantes de todo el mercado laboral ¿Cómo ser científico de datos?

Una de las claves para comprender la demanda y el dinero que gana un científico de datos está en la propia complejidad de esta figura profesional. Hablamos de un cuadro productivo que funda sus conocimientos sobre las matemáticas, la Estadística, la programación y lo más importante, la visión necesaria para crear riqueza a partir del conocimiento que puede extraerse de un análisis científico de los datos a su alcance.

Lo anterior se traduce en algo del máximo valor estratégico para cualquier empresa: el científico de datos se sienta sobre su mesa a pensar cómo convertir los datos en ventajas competitivas. ¿Qué podemos concluir de lo anterior? Es evidente, quiénes tienen la mejor perspectiva en las nuevas industrias digitales son aquellos que se sumergen en formaciones 100% enfocadas al análisis de datos.

Pero regresemos a la pregunta inicial: ¿Cómo ser científico de datos?

Entran en juego varias áreas técnicas que, opinan los expertos, se tornan fundamentales. La formación en ciencia de datos nos conduce a ciertas necesidades ineludibles, por ejemplo, los conocimientos matemáticos (no debe perderse de vista que estamos hablando de aparatos científicos). Sin embargo, se trata de matemáticas que regresan o conectan una y otra vez con problemas centrales de la Estadística.

Posteriormente, nos enfrentamos a la cuestión de los lenguajes, por ejemplo R o Python, que resulten aplicables al Data Science. Existe un claro liderazgo de los lenguajes anteriormente nombrados. Podríamos decir que R y Python nos permiten enfrentar cualquier problema importante en análisis de datos, tanto pequeños experimentos de interfaz cómo grandes desafíos en procesamiento.

Si bien ambas herramientas prácticamente ofrecen similares posibilidades, R está más centrada en el ámbito estadístico. A difernecia de Python que se utiliza más en áreas técnicas. Y tenemos una de las tareas que más sorprende e impulsa la sed de conocimiento del científico de datos en formación: adaptación e implementación de modelos estadísticos y algoritmos interconectados muy avanzados.

Pero más adelante, durante la persecución a la pregunta central de esta entrada (¿cómo ser científico de datos?), llegamos a las bases. Poder construir tablas de datos que se correlacionan entre sí no representa un desafío técnico demasiado grande, sin embargo, encontraremos cierta resistencia a explorar la que quizás es uno de los componentes más didácticos de la disciplina que nos ocupa. Se trata de una adaptación matemática de las teorías de conjuntos que nos permiten estructurar datos buscando la mayor optimización. SQL es una herramienta, como otras en el mercado, que nos explotan de manera directa los datos para encontrar relaciones visibles entre ellos, pero está lejos del proceso de análisis completo a través de la modelización estadística.

SER UN CIENTÍFICO DE DATOS

Supongamos que usted, finalmente, encontró el lugar ideal donde formarse a nivel superior como científico de datos. Es decir, logró una Universidad de prestigio y a la vanguardia en tecnología, con los mejores contenidos y profesores reconocidos, con una visión integral (aplicado a sectores estratégicos) y el necesario enfoque al análisis de datos.

Bien, lo que sigue es pensar y actuar como un auténtico científico de datos. En primer lugar, es necesaria la claridad sobre cómo queremos estructurar la información. En segundo lugar, necesitamos implementar una cultura organizacional en la empresa que permita una canalización o embudo de datos ágil, inmediato y eficiente. Como tercer punto diremos que es necesario el conocimiento con la fundamentación suficiente como para crear un manejo, graficación y visualización útil a la investigación sobre esos datos.

Y cuarto, muy importante, el tratamiento científico de los datos debe permitir que las decisiones de la empresa arriben a una racionalidad nueva. Interrogantes correctos dirigidos a los datos nos permiten llegar a un conocimiento del cliente con la profundidad necesaria como para hacer cosas como personalizar el producto o el mensaje. Y lo anterior sin traspasar las líneas marcadas por la privacidad.

En este sentido, el científico de datos debería tener a su alcance la posibilidad de construir modelos de predicciones que respondan a necesidades en tiempo real y sin que los clientes nos cuenten (porque no lo harán) detalles de sus consumos o sus planes futuros.

En conclusión, la respuesta a la pregunta (¿cómo ser científico de datos?) pasa por una certeza: el científico de datos es quien hoy por hoy responde a “las preguntas” importantes de la empresa.


Experto, Especialista y Máster en Big Data y Data Science de la UNED: Reserva de plaza - Convocatoria 2023

Ciencia de Datos