Big Data y Data Science para observar al Universo, Astronomía y Big Data, SETI Big Data y Ciencia de Datos

Investigación y exploración espacial son lugares de alianza entre la Industria y la Academia. Big Data, Data Science o Inteligencia Artificial se han convertido en áreas del conocimiento necesarias para los más importantes proyectos de observación del Universo, demandando enfoques multidisciplinares, así como científicos y profesionales de extraordinaria preparación.

Es un hecho que las nuevas misiones de exploración de la NASA (sobre todo luego de la exitosa colaboración con SpaceX) entienden como un objetivo estratégico el aprovechamiento de los grandes volúmenes de datos arrojados por las plataformas de observación donde la Agencia estadounidense participa.

En efecto, los datos no son un negocio aparte en el millonario acuerdo de colaboración entre la NASA y la compañía de Elon Musk, su estudio es clave para desarrollos tecnológicos y proyectos de investigación en terrenos como la autonomía de las misiones robóticas o el aprendizaje e interpretación del Universo observable. Big Data, Data Science, Inteligencia Artificial, etc. se convierten en partes indisolubles de la actual industria espacial.

En el caso de la Inteligencia Artificial asistimos a una alianza entre saberes que involucran Psicología, Filosofía, Matemática, Economía, Informática, etc. Todo en busca de cierta amalgama metodológica que une matrices de datos y software muy sensibles a la interpretación y la acumulación de aprendizajes. La experiencia en grandes empresas científicas como el SETI han demostrado las ventajas del enfoque multidisciplinar durante la extracción de conocimiento y riqueza de los datos. En este sentido, la política de la NASA es la configuración de equipos humanos con formación avanzada en Ciencia de los Datos e Inteligencia Artificial.

¿QUÉ BUSCAMOS AL MIRAR A LAS ESTRELLAS?

¿Cuál es una de las metas científicas más ambiciosas, deseadas y esperadas de las últimas décadas? Entre las respuestas posibles debemos incluir todo lo que implica la búsqueda de vida extraterrestre, tal vez el rastro de su antigua presencia. Y no hablamos, de forma un tanto fantasiosa, del encuentro con una civilización tecnológica, es más bien el hallazgo de una forma de vida relativamente más primitiva. Este fin, cómo no, se relaciona íntimamente con los esfuerzos de observación que escudriñan el espacio para rastrear sistemas solares y planetas parecidos al nuestro, posibles candidatos a albergar vida.

Pues bien, en años recientes muchos científicos comenzaron a tomarse en serio tales investigaciones gracias al espectacular aumento de los datos disponibles, al crecimiento de la capacidad técnica para el procesamiento y almacenaje, así como a la llegada de algoritmos mucho más avanzados que, por ejemplo, los originalmente utilizados en SETI.

Ahora arribamos a un momento donde Big Data, Ciencia de Datos, Robótica, etc. permiten hablar de detección inteligente entre un auténtico océano cósmico de información.

Cualquier país que quiera preservar su industria aeroespacial e intereses o dosis de liderazgo en la investigación y exploración del espacio (y España hace parte de la lista), necesita profesionales extraordinariamente formados en Big Data y Data Science. Es más, un perfil que, por ejemplo, se extiende en los Estados Unidos y algunos países europeos, consiste en ingenieros, astrónomos, programadores, etc. que están incorporando a sus credenciales una formación superior en esas áreas.

Grandes organizaciones como la NASA o la ESA actúan como punto de convergencia donde se tocan Industria y Academia en cometidos totalmente apoyados en Ciencia de Datos e Inteligencia Artificial.  En sentido de lo anterior, trazados de trascendental importancia para el futuro de la especie como la exploración de Marte o la observación del espacio profundo están necesitando mayores inversiones en el análisis y aprendizaje a partir de los datos, del que depende la creación de aplicaciones y la anticipación a eventos inesperados en condiciones extremas (como las enfrentadas en una misión robótica a Marte).

CIENCIA DE DATOS EN LA EXPLORACIÓN DEL UNIVERSO

Pero tal vez donde más se nota el peso estratégico de los datos es en los proyectos de observación. Una de las promesas del Instituto SETI, que busca atraer el interés del público y la industria, es la variedad de aplicaciones terrestres que pueden resultar de sus soluciones para explorar el Universo. Sus equipos científicos experimentaron una especie de cambio en el relato, desde hace poco tiempo, cuando pasaron a definir como puntos de datos a las lecturas que estudiaban en busca de una señal de origen inteligente.

El Instituto se enfrenta, literalmente, a millones de filas de datos llegados desde el Allen Telescope Array (ATA), creado junto al Laboratorio de Radioastronomía de la Universidad de California en Berkeley. Este complejo se levanta como un radiotelescopio de interferometría, útil tanto en la observación astronómica como en la búsqueda de patrones en los datos que delaten una posible inteligencia extraterrestre. 

Uno de los grandes desafíos en Ciencia de Datos que plantea el ATA es que su acción genera un flujo de más de 60 gigabytes de datos por segundo durante las 24 horas del día. Se producen consultas Apache Spark que ruedan sobre más de 200 millones de filas de datos durante algo menos de 3 minutos. Así, el gran reto es separar el ruido (firmas de radar, radio, satélites, etc.) de las señales que puedan resultar interesantes. 

Para esto se han creado soluciones en computación cognitiva que logran identificar, por ejemplo, el rastro de los aviones comerciales o la reverberación producida por objetos humanos en órbita para separarlos de las señales espaciales. Se basa en un procesamiento a varias capas en distintos intervalos de tiempo, originando un aprendizaje que se acumula. Lo que ocurre a continuación es que la llegada de cierto aprendizaje libre de supervisión humana comienza a revelar cosas que los científicos ni siquiera se habían llegado a plantear. En lo no-estructurado podría estar escondida la clave a alguna gran pregunta de la ciencia.

Por otra parte, los revolucionarios algoritmos desarrollados en el ya veterano e incombustible SETI (en colaboración con IBM jStart) pueden utilizarse para abordar el análisis inteligente de cualquier serie o colección de puntos de datos. Por ejemplo, podrían resultar de utilidad en la información acumulada por lo que denominamos como Internet de las Cosas. Fabricación de piezas, industria de precisión, ciencia de los materiales, biometría o generación de energía, cualquier ámbito de la producción que demande separar el ruido de las señales o datos de fondo tiene una respuesta en estos algoritmos.  

Es meridianamente claro que articular una de las soluciones en Ciencia de Datos o Inteligencia Artificial, creadas para proyectos como el antes nombrado, para solucionar un problema o una demanda en ámbitos, por ejemplo, de la Economía, otras industrias o la dirección empresarial, implica una formación al más alto nivel; además, adaptada a las condiciones actuales (donde mayúsculas crisis como el coronavirus nos están obligando a cambiar la forma de hacer las cosas). El hecho real es que hay conocimientos y herramientas que ya están ahí, esperando a que un profesional en Big Data y Data Science se atreva a dar el siguiente paso. 


Experto, Especialista y Máster en Big Data y Data Science de la UNED:

CONVOCATORIA 2024 - MATRÍCULA ABIERTA