EL CIENTÍFICO DE DATOS

¿Cómo sería el desempeño de un científico de datos en una estructura productiva que se pregunta las típicas cuestiones sobre mejora de su ciclo de operaciones o ventas? En líneas generales, ¿cómo se aplicaría el Data Science en los aspectos que realmente forman la cotidianidad de la compañía? El científico de datos, esa figura profesional tan codiciada, es una de las claves del éxito empresarial y las innovaciones que luego se convierten en tendencia.

¿Qué hace un científico de datos? En este blog hemos hablado de muchas cosas. Sin embargo, tal vez nos hemos referido poco, precisamente, a lo que hace concretamente un científico de datos.

Cuando un profesional enfocado a ciencias de los datos pasa a formar parte de una estructura productiva y comienza a estudiar las matrices con las que puede trabajar, entre sus objetivos (dado que tiene un perfil científico) está dar con descubrimientos a partir de la información a su alcance.

Sin embargo, las necesidades son distintas si está en una compañía, en una institución del Estado, en un equipo de investigación dentro de alguna Universidad, etc. En caso de estar en una empresa, uno de los escenarios frecuentes será que le presenten una batería de necesidades algo abstractas y relacionadas con la generación de oportunidades de negocio, ventas, etc. y la transformación de un porcentaje de éstas en operaciones reales que producen recursos económicos. Es decir, el científico de datos puede entrar en contacto con demandas productivas que todavía no están coherentemente traducidas a los lenguajes propios de su campo.

Pero las metodologías que conforman a la Ciencia de los Datos permiten construir los interrogantes iniciales correctos, aunque el problema inicial no se presente como algo propio del Data Science. Los retos a los que se enfrenta una empresa que decide utilizar sus datos de forma inteligente para basar en ellos sus decisiones estratégicas deben experimentar un viaje hacia lo concreto, el problema formulado como relato corporativo debe interpretarse para convertirlo en un “problema de datos”. Lo anterior nos llevará a instaurar un proceso de trabajo diferenciado, es a esto a lo que denominamos como Ciencia de Datos.

EL CIENTÍFICO DE DATOS EN ACCIÓN

EL CIENTÍFICO DE DATOS EN ACCIÓN

Para empezar, el científico de datos toma toda la información que le transmiten las otras áreas de la producción y recontextualiza el problema. Luego, mediante un procedimiento científico, crea sus formulaciones y árboles con el fin de empezar a trasladar la cuestión a los datos.

Ciertas preguntas son neurálgicas en este comienzo. Si, efectivamente, la necesidad está siendo transmitida por aquellos que se preocupan por generar oportunidades que se convierten en operaciones económicas, pues el punto de partida es más o menos evidente: ¿Cuál es el perfil general del cliente? ¿Cómo lo han encontrado hasta ahora? ¿Cómo se han cerrado las operaciones o ventas hasta ese momento y, muy importante, qué información queda en manos de la empresa durante todo ese proceso?

Por supuesto, estos interrogantes se reproducen a sí mismos, ya que un bien o servicio puede estar desglosado, estratificado, etc. Recordemos que estamos refiriéndonos a un cuadro profesional con una formación en ciencia de los datos, que en parte pretende utilizar esos datos para desentrañar parcelas de la conducta tanto de su empresa como de los clientes. Así, arribará a interrogantes como dónde están los segmentos objetivo dentro de X población, cómo es la relación entre tales segmentos y las conversiones finales, dónde está la mayor eficiencia en dicha relación, cómo está funcionando el retorno de las inversiones, etc.

Posteriormente se preguntará por los datos brutos que necesita para desarrollar sus formulaciones, si éstos ya existen necesitará saber qué parte de las bases le resultan verdaderamente útiles para el análisis. Lo anterior despejará la pregunta sobre qué recursos técnicos serán imprescindibles.

Durante la siguiente etapa del proyecto son necesarias varias tareas de procesado de los datos, dado que es frecuente encontrar todo tipo de errores durante la recolección de los registros. En otras palabras, se deben realizar un preprocesado de las variables e información con la que estamos trabajando. Cuando ese “trabajo de limpieza” ha concluido y los formularios están creados, el científico pasaría a un nuevo nivel de exploración. La finalidad de este momento del análisis es conseguir una comprensión mucho más profunda de la matriz con la que estamos trabajando: las pautas, las correlaciones, ciclos, tendencias, etc.

Y llega el momento del Aprendizaje Automático. El Machine Learning pone al servicio del científico de datos la potencia de los algoritmos, la estadística, etc. para edificar modelos de perspectiva y predicción que vendrán a formar, en ese momento, la piedra angular del análisis de datos.
A lo anterior sigue, por supuesto, todo el esfuerzo para construir visualizaciones e informes que resulten útiles para comunicar de forma pedagógica los hallazgos. Lo que venimos describiendo es, ni más ni menos, que el desarrollo que convierte el relato colmado de ambigüedades en formulaciones con respuestas provistas de sustento matemático.

Como hemos nombrado en entradas anteriores de este blog el abordaje científico de los datos también busca hallar las preguntas correctas, esas que ni siquiera sospechábamos que podían hacerse. En efecto, los datos suelen tener codificados conocimientos sobre la actividad productiva cuya interpretación de la enorme riqueza de los múltiples puntos de vista, aquellos que permiten ver la realidad desde más de un ángulo y elevan las posibilidades de éxito del proyecto.

Entre las primeras conclusiones bebemos destacar que para las compañías que pretendan sobrevivir a estos tiempos marcados por ciclos de prosperidad y crisis, por lo tanto de incertidumbre, es vital la adopción de una cultura de análisis de datos que oriente mejor sus decisiones. Claramente, esto solo es posible mediante perfiles profesionales muy específicos, el científico de datos. Por supuesto, asegurándose la empresa de que cuenta con el profesional con las mejores credenciales académicas en Data Science.