LENGUAJE DE PROGRAMACIÓN PYTHON: EL AQUÍ Y AHORA DEL ANÁLISIS DE DATOS, CON PERMSO DE R

El lenguaje de programación Python, con permiso de R, encabeza las listas de los más utilizados: es el aquí y ahora del análisis de datos. Gratuito y sencillo de utilizar, multiplataforma y multiparadigma. Python se presenta como la herramienta concreta que presta sustento a las grandes revoluciones tecnológicas de nuestra época: Big Data, Data Science, Inteligencia Artificial o Deep Learning. Su plasticidad le coloca en el papel estrella dentro de proyectos de investigación científica, así como en algunos de los más osados desafíos asumidos por las grandes agencias y los gigantes tecnológicos.

IEEE Spectrum es una publicación especializada en ciencias aplicadas e ingeniería, su último sondeo sobre los lenguajes de programación más implantados y utilizados en el mundo da a Python el primer lugar, seguido de Java, C, C ++, Javascript y R.

Algunas voces expertas explican la amplia difusión de Python por su adaptabilidad a multitud de entornos y su sencilla utilización. Esto, a su vez, se relaciona con que las formaciones más avanzadas en Deep Learning, aquellas con un enfoque integral, tengan en Python uno de sus puntos de referencia.

La plasticidad de Python, su carácter gratuito y aplicabilidad hacen pensar qué será el “idioma” de programación más exitoso de los próximos años; si pretendiéramos hacer una conceptualización general de lo que es y la función que cumple, tendríamos que destacar varias cuestiones. Su utilización prácticamente viabiliza algunos de los más importantes desarrollos en Big Data, Data Science, Inteligencia Artificial, Deep Learning y desarrollos Web avanzados.

Es decir, hablamos de una herramienta al alcance de cualquiera dispuesto a invertir tiempo y esfuerzo en la formación necesaria. Vemos un enfoque de programación capaz de asumir grandes retos en la solución de problemas relacionados con el análisis de la información, gracias a su estructuración generalista (no olvidemos su biblioteca, que permite numerosas aplicaciones).

PYTHON: MULTIPLATAFORMA Y MULTIPARADIGMA

Probablemente, lo que hace estratégico a Python es su “personalidad” multiplataforma y multiparadigma. Desde su nacimiento, hacia el año 1989, ha pretendido responder a una necesidad real del mundo académico, las compañías y el mercado en general: un lenguaje interpretado, sencillo, con una funcionalidad basada en lo intuitivo y la potencia para responder a las necesidades que hoy caracterizan a los gigantes corporativos.

Al parecer, importantes compañías y organizaciones relacionadas con tecnología están incursionando en la Ciencia de Datos, el Machine Learning y el Deep Learning a través de Python; destacando a la NASA, Google, Facebook e incluso Netflix (cuyo éxito está sentado en un análisis inteligente de grandes volúmenes de datos, generando un conocimiento profundo acerca de la personalidad y los consumos de sus usuarios).

La encuesta Python Developers Survey 2019 Results, del año 2019, llamó la atención sobre la enorme cantidad de desafíos que este lenguaje de programación estrella era capaz de resolver. Al parecer, cerca del 60% de los profesionales formados en Python se desempeñan en proyectos relacionados con dinámicas de “analítica masiva” de datos (tomando prestado un término de las ciencias sociales). Con análisis de datos, hablamos de aquellos que pueden navegar por el océano de los datos para encontrar respuestas a preguntas que, en algunos casos, ni siquiera sabíamos que estaban ahí.

En efecto, el lenguaje de programación Python es el aquí y el ahora del análisis de datos. Además, el conocimiento y manejo de Python permite incursionar en pruebas de software, la creación y programación de analizadores Web, scripts de automatización, Aprendizaje Automático y Aprendizaje Profundo.

Lo anterior se relaciona, ni más ni menos, con lo que antes denominamos la “personalidad” de Python. Es decir, bajo las premisas de una herramienta de código abierto, gratuita y relativamente sencilla de aprender, llegamos a un instrumental enfocado al análisis de datos que puede ejecutarse en Windows, Linux y otros. A partir de lo anterior, un analista o científico de datos puede escribir su código, persiguiendo los modelos de construcción o paradigmas en dónde se inscriba su trabajo, con el fin de que Python traduzca y ejecute.

La realidad es que dar los primeros pasos en el aprendizaje de Python es muy fácil: el paquete se descarga desde python.org. Luego de la ejecución podemos utilizar un editor de código para comenzar, lo habitual es que cada programador tenga su preferido: PyCharm, Wing, etc. La estrategia más general que utilizan los profesionales es implementar la versión de Anaconda que ya viene precargada con la mayoría de las librerías utilizadas en Data Science, además de otros recursos muy útiles, entre los que se encuentran Jupyter y Spyder y entornos de desarrollo del lenguaje de programación Python. (https://www.anaconda.com/products/individual)

PYTHON Y DEEP LEARNING

En una entrada anterior de este Blog decíamos: Deep Learning aquello de lo que habla tanta gente en el mundo de la Inteligencia Artificial. En efecto, una parte muy importante del éxito observado en el Aprendizaje Profundo deriva del enorme poder que muestran lenguajes como R y Python, se trata de “instrumentos” sencillas pero que permiten proyectos muy avanzados en ciencia y análisis de datos. De ahí que hablemos de lenguajes ampliamente utilizados por los gigantes tecnológicos.

La demanda que el tejido productivo está generando de profesionales con formación avanzada en áreas como Deep Learning, lo que involucra la programación en Data Science a través de R y Python, encabeza varios análisis sobre la evolución de estos nichos extremadamente especializados del mercado laboral.

Big Data y Data Science, más R y Python, se están convirtiendo en piedra angular en la industria de los transportes, los seguros, las finanzas y la banca; además de la ya conocida necesidad en la investigación científica, el desarrollo de software y las tecnologías de la información.

Claro, formarse en Deep Learning (contemplando la programación en R y Python, recordemos la importancia del enfoque integral), es útil más allá del contexto laboral en una gran corporación o en la investigación académica. Dado que también estamos ante una gran comunidad de programadores compartiendo recursos y trabajando en multitud de proyectos colectivos: cuestiones sociales, ambientales, culturales, etc.

En conclusión, si hoy podemos hablar de paradigmas tecnológicos que se traducen en revoluciones permanentes (como Big Data, Data Science, Aprendizaje Profundo, etc.), metodologías y enfoques que cada día sorprenden más que el anterior, es porque existen una serie de metodologías que “re-objetivan” el trabajo de origen humano. Pues bien, una de ellas es el lenguaje Python. No parece posible que los enormes avances que están por venir en ámbitos como el análisis de datos o la Inteligencia Artificial vayan a estar ajenos al crecimiento de profesionales e investigadores con habilidades y formación en, por ejemplo, Deep Learning a través de Python y R.