Big Data: retos y aplicaciones. Como contábamos en la entrada anterior de este Blog, ese es el nombre del CURSO ONLINE introductorio que los directores del Máster en Big Data y Data Science de la UNED organizan en próximos días (27 y 28 de octubre) desde el Centro Asociado de las Islas Baleares. 

Preguntando a su director por la motivación central de esta formación, éste nos explicaba la necesidad de articular acciones que den acceso al mundo del Big Data y el Data Science a personas que están en proceso de aclarado de conceptos y estudio de las posibilidades que abre la transformación digital.

El primer bloque consistirá en una aclaración y profundización de conceptos: la línea lógica entre Big Data y Data Science. Será un espacio muy propicio para desglosar las definiciones que están dando tanto de qué hablar en los últimos tiempos.

Se explicará cómo el Big Data viene generado por los componentes electrónicos que usamos diariamente (tarjetas bancarias, redes sociales, etc.) y todos los datos que producen. Sobre cómo las herramientas del Big Data están orientadas a lograr gestionar bases de datos con millones de registros (totalmente imposibles de procesar son los métodos “tradicionales”). Habrá referencias a unas dimensiones en el universo de datos que obligan a trabajar con lo que se denomina “entornos distribuidos”: la combinación de varias máquinas o bien, por ejemplo, la reserva de un servidor de memoria en Amazon para trabajar conjuntamente con nuestro equipo.

Y, por supuesto, se conectará todo esto con la conceptualización del Data Science, el siguiente paso: si tenemos la información y podemos analizarla (gestión y consultas) ahora debe ser posible extraer información no trivial y útil en la edificación de conclusiones.

Estamos, de nuevo, ante un encuentro entre técnica y ciencia… metodología y saber. Sin dejar de lado la mención (en este curso breve online) a las tres tendencias del Data Science: la Estadística clásica, la inferencia bayesiana y la inteligencia artificial (donde nos encontramos no con una estructura probabilística subyacente  sino con un algoritmo que puede aprender a medida que va procesando los datos, observando el principal ejemplo en la red neuronal que tiende a imitar nuestro funcionamiento nervioso).

Esta primera parte dará pie al fin principal: una iniciación en las herramientas.

Con la correspondiente introducción a Hadoop, Sparklyr, Weka, R y Python. Esta última cuestión bastante interesante, a causa del debate que existe sobre la “competencia” entre R y Python: el primero de mayor difusión frente a la visibilización que ha ido ganando el segundo con la fuerte entrada de los profesionales informáticos en esta área. Es, por supuesto, conocido que Python es un lenguaje de programación estructurado de ámbito general, aunque con ciertas funciones estadísticas. Mientras R es un lenguaje no estructurado y con gran cantidad de funciones estadísticas.

El hecho de que normalmente un profesional informático esté más habituado a trabajar con lenguajes de programación estructurados contrasta con la gran presencia de R en lo referente a grandes volúmenes de datos. Así, tenemos que en campos de estudio de gran amplitud como los contenidos en las ciencias sociales la “estrella” sigue siendo R.

En el segundo bloque del curso online se proporcionará una visión general de las técnicas del Data Science, dividiéndolo en cuatro partes: clasificación, agrupación, reducción de dimensiones y regresión.

A cada una de esas partes se asociará un ejemplo que intentará mostrar el alcance de cada técnica: un árbol de decisión (de gran valor visual), un modelo de regresión logística, un modelo de clasificación y uno de regresión lineal (vista desde los tres enfoques del análisis de datos).  La clase empleará su mayor espacio en la explicación de los resultados.

Uno de los aspectos realmente fascinantes de este tipo de formaciones introductorias es una explicación acerca de los niveles de desarrollo y aplicación (adaptación) que caracterizan el Data Science: un científico de los datos puede hacer, por ejemplo, una clasificación con estadística clásica (como un algoritmo de k medias o un Clúster en dos fases), pero también puede hacer ese algoritmo de clasificación con inferencia bayesiana o inteligencia artificial. Es decir, un espectro verdaderamente grande situaciones son asumibles con estas técnicas y herramientas.

Todos esos alcances serán, cómo no, ampliamente estudiados en el programa de Experto, Especialista o Máster en Big Data y Data Science online de la UNED, cuyo periodo de matriculación está abierto en estos momentos.

Recordemos que este curso otorga 1 crédito ECTS y 2 créditos de libre configuración. Más información en este enlace

0
0
0
s2smodern
powered by social2s

En el Blog

ContactAR

Información y matriculación

Facultad de
Ciencias Económicas y Empresariales

  • Paseo Senda del Rey, 11. 28040 Madrid.
  • Email de información:
    Esta dirección de correo electrónico está siendo protegida contra los robots de spam. Necesita tener JavaScript habilitado para poder verlo.

Este sitio usa cookies

Si sigues navegando entendemos que aceptas nuestra política de cookies Saber más

Acepto

Política de cookies

La Universidad Nacional de Educación a Distancia y el Máster de Big Data y Data Science informa acerca del uso de las cookies en sus páginas web para mejorar los servicios que se prestan a través de la misma.

Las cookies son archivos que se pueden descargar en su equipo a través de las páginas web. Son herramientas que tienen un papel esencial para la prestación de numerosos servicios de la sociedad de la información. Entre otros, permiten a una página web almacenar y recuperar información sobre los hábitos de navegación de un usuario o de su equipo y, dependiendo de la información obtenida, se pueden utilizar para reconocer al usuario y mejorar el servicio ofrecido.

Aceptación de la Política de cookies

La UNED asume que usted acepta el uso de cookies. No obstante, muestra información sobre su Política de cookies en la parte inferior de cualquier página del portal con cada inicio de sesión con el objeto de que usted sea consciente.

Ante esta información es posible llevar a cabo las siguientes acciones:

  • Aceptar cookies. Se trata de una aceptación tácita, siendo una política aceptada por el hecho de usar el portal web de la UNED.
  • No aceptar las cookies. Abandonar la navegación en el portal web de la UNED.
  • Modificar su configuración de su navegador. Podrá obtener más información sobre qué son las cookies, conocer la Política de cookies de la UNED y modificar la configuración de su navegador.

Otra información de interés

Tipos de cookies

Según la entidad que gestione el dominio desde donde se envían las cookies y trate los datos que se obtengan, se pueden distinguir dos tipos: cookies propias y cookies de terceros.

Existe también una segunda clasificación según el plazo de tiempo que permanecen almacenadas en el navegador del cliente pudiendo tratarse de cookies de sesión o cookies persistentes.

Por último, existe otra clasificación con cinco tipos de cookies según la finalidad para la que se traten los datos obtenidos: cookies técnicas, cookies de personalización, cookies de análisis, cookies publicitarias y cookies de publicidad comportamental.

Para más información a este respecto puede consultar la Guía sobre el uso de las cookies de la Agencia Española de Protección de Datos

Cookies utilizadas en la web de la UNED

A continuación se identifican las cookies que están siendo utilizadas en este portal así como su tipología y función:

  • Google Analytics. En su navegador podrá observar esta cookie denominada _ga. Según la tipología anterior se trata de cookies de terceros, de sesión y de análisis. Los datos que se recopilan, procesan y almacenan en la cuenta de la UNED de Google Analytics, están protegidos y se conservan de manera confidencial. Los datos de Google Analytics se utilizan únicamente para fines estadísticos, siendo el único dato considerado como de carácter personal tratado en este servicio la dirección IP.

Puede encontrar más información al respecto e inhabilitar el uso de estas cookies www.google.es/intl/es/analytics/privacyoverview.html

A través de la analítica web se obtiene información relativa al número de usuarios que acceden a la web, el número de páginas vistas, la frecuencia y repetición de las visitas, su duración, el navegador utilizado, el operador que presta el servicio, el idioma, el terminal que utiliza, o la ciudad a la que está asignada su dirección IP. Información que posibilita un mejor servicio de este portal.

  • UsuarioUNEDv2. Cookie de sesión (con un periodo de validez de 12 horas), propia y de tipo técnico, cookie firmada digitalmente únicamente es accesible por otros sistemas mediante SSL. Permite la navegación por el portal de forma personalizada, además de permitir mediante una única validación del usuario en el portal, acceder a otros sistemas y/o servicios de forma transparente, sin necesidad de tener que volver a identificarse
  • ASP.NET_SessionId. Cookie de tipo técnico, propia y de sesión. Cookie generada por el servidor. Esta cookie permite almacenar un identificador único por sesión a través del que es posible vincular datos necesarios para posibilitar la navegación en curso.
  • SSO_SesionID. Cookie de tipo técnico, propia y de sesión. Empleada por el portal corporativo para gestion de privilegios del usuario.
  • JSESSIONID. Cookie de tipo técnico, propia y de sesión. Empleada por componente java del servidor para posibilitar la navegación en curso.

Cómo modificar la configuración de las cookies

Usted puede restringir, bloquear o borrar las cookies de la Universidad Nacional de Educación a Distancia o cualquier otra página web, utilizando su navegador. En cada navegador la operativa es diferente, la función de ‘Ayuda” le mostrará cómo hacerlo.

Ir al principio