¿HABLAMOS DE REDES NEURONALES CONVOLUCIONALES?

Las redes neuronales convolucionales forman una de las piedras angulares de importantes paradigmas tecnológicos como el Aprendizaje Profundo, la Inteligencia Artificial, el Big Data y el Data Science. Nos encontramos con una arquitectura neuronal bidimensional sorprendente en el análisis inteligente de imágenes y enormemente prometedora en otros campos, a la vez que alimentadora de grandes debates en disciplinas como la Psicología entre otras. Redes neuronales convolucionales, una asignatura clave para los profesionales en Big Data y Data Science.

La Inteligencia Artificial y el Deep Learning han sido protagonistas de una parte muy importante de la revolución tecnológica de estos años. Los avances en la visualización, con redes neuronales especialmente enfocadas al trabajo con imágenes (las redes neuronales convolucionales) han sido literalmente enormes. Hablamos de una red neuronal que puede diferenciar patrones complejos entre gigantes bancos de imágenes.

La máquina que finalmente tiene “ojos” para trabajar en complicadas tareas médicas, urbanas o administrativas es algo prácticamente equivalente, desde criterios evolutivos, a la complejización de una suerte de “percepción” de la realidad (digital) todavía rudimentaria (aunque no por eso menos extraordinaria).

¿Qué buscamos decir con lo anterior? Bueno, nuestro tremendamente avanzado cerebro, con todas las extensiones nerviosas y la información enviada por los sentidos, puede determinar si una imagen que estamos observando pertenece a un elefante, un delfín o a la expresión sorprendida de nuestros padres el día que supieron que iban a ser abuelos.

La experiencia acumulada nos proporciona información para saber si la imagen pertenece a un humano, en base a dónde están los ojos, la nariz, etc. A su vez, podemos determinar la naturaleza de la imagen gracias a que identificamos, a un nivel mucho más profundo, los patrones geométricos, las coloraciones y contrastes esperables.

Un modelo digital de lo que ocurre nos mostraría una enorme cantidad de datos fluyendo y el procesamiento en el córtex visual, lo que permitirá generar niveles de aprendizaje donde seremos capaces de identificar variantes cada vez más complejas de la misma geometría. Pues bien, este mismo modelo fue parte de la base con las que se escribieron las primeras redes neuronales convolucionales, que basan su éxito en la detección de rasgos claros de la imagen. Esta red neuronal crea una capa que contiene a la propia convolución, que viene a ser una ejecución matemática donde los parámetros o valores de los píxeles se simbolizan con matrices numéricas.

Lo anterior es algo seriamente valorado por los desarrolladores y profesionales de software enfocado a trabajo visual. La matriz numérica, cuyos valores podrían moverse, puede generar nuevos píxeles, ejerciendo como filtros generadores de variantes a partir de la primera imagen. Este avance es ya parte de la edición y ajuste de imagen profesional.

RED NEURONAL CONVOLUCIONAL

Lo que estamos describiendo es, sencillamente, una red neuronal que puede programarse para encontrar rasgos o características distintas sobre las imágenes. Si bien, todo depende de los valores dados a la matriz numérica que actúa como filtro. No obstante, no pasemos por alto que esos valores pueden ser producto del aprendizaje de la red neuronal. Es decir, aprende a crear filtros que depuran cada vez más la detección de patrones.

Genéricamente, las nuevas imágenes o variantes creadas se denominan como mapa de características. Las operaciones se realizan en etapas, es decir, cada capa alimenta a la siguiente. Y no olvidemos que las propias dimensiones de los mapas de características pueden variar. Por ejemplo, analizar la imagen con ocho matrices numéricas de 10 x 10 píxeles nos dará como resultado otros ocho mapas de características, que pasarán a alimentar la siguiente convolución, hasta lograr detectar patrones con un nivel muy grande de detalle, gracias a la profundidad de arquitectura conseguida. Es esta la forma como las redes neuronales saben, cada vez mejor, dónde hay, por ejemplo, un ojo, un lunar o unos labios. Nos están mostrando resultados sobre resultados previamente hallados, estructurados de forma jerárquica. Este tipo de soluciones son, como sabemos, de gran relevancia en el Deep Learning, a la vez que un contenido importante en las formaciones superiores en Big Data y Data Science.

Por otra parte, todo esto presenta una trama narrativa de gran interés para las ciencias sociales. Una red neuronal es un conjunto de operaciones matemáticas simultáneas, con distinta dimensión, a las que, ciertamente, es complejo proveer totalmente de lógica o entendimiento. El hecho es que, si nuestra red neuronal es operativa, cabe la posibilidad de observar la emergencia de cierto comportamiento que, al estudiarlo, muchos científicos, psicólogos y filósofos se preguntarían con ansiedad si es primariamente inteligente.

Naturalmente, la operativa matemática que articula la red también sirve para desentrañar su comportamiento, aunque esto no hace otra cosa que avivar el debate en términos psicológicos y filosóficos. En cualquiera de los casos, nos estamos refiriendo a un campo del conocimiento extraordinariamente prometedor, inherente a los expertos y especialistas en Big Data y Data Science, y que se acerca sensiblemente, desde el universo digital, a la idea de campo receptivo que ayuda a explicar el super-eficiente funcionamiento de las neuronas en la corteza visual primaria.

Así, desde una variación del exitoso perceptrón multicapa arribamos a arquitecturas bidimensionales, más allá de los límites lineales, que hacen posible una percepción visual de naturaleza artificial; ahora utilizada en el análisis inteligente de grandes bases de imágenes, pero que tiene un interesantísimo futuro en otros campos como la investigación espacial o la exploración planetaria, entre otros.


 Experto, Especialista y Máster en Big Data y Data Science de la UNED: Matrícula abierta