Mapas autoorganizativos Kohonen

Mapas autoorganizativos Kohonen

Introducción - Mapas autoorganizativos Kohonen

En el año 1982 Teuvo Kohonen presentó un sistema de comportamiento bastante similar al funcionamiento del cerebro. Este sistema fue conocido como los Mapas autoorganizativos Kohonen cuya existencia facilitaba una forma de representar los datos numéricos multidimensionales (vectores) en espacios vectoriales de dimensión inferior (2D/3D). Dicho de otro modo, son un algoritmo que mediante un proceso iterativo de comparación de una serie de datos es capaz de crear un modelo que los agrupe por criterios de similitud; hay que añadir que ese agrupamiento se produce de forma que la proyección de los datos analizados sobre el mapa permita distribuir sus características de una forma gradual. 

 

Cabe destacar que los SOM aprenden a clasificarse sin supervisión. Esto quiere decir que no se necesita un objetivo que aproximar, sino que desarrolla la distribución a partir de la semejanza que encuentra entre los vectores.

Arquitectura en red

El algoritmo SOM interpreta una arquitectura dividida en 2 capas:


  • Por una parte, la capa de los nodos de aprendizaje. De esta únicamente nos interesa la relación que existe entre los mismos, es decir, las conexiones y la estructura que forman entre ellos. Además, estos serán los que contendrán la información de la representación resultante.
  • Por otra parte, una capa de nodos de entrada, que serán los que alimenten a los nodos de aprendizaje a través de los vectores originales (que son los datos) durante el proceso de entrenamiento.


Es importante mencionar que todos los elementos que se encuentran en la primera capa descrita se encuentran conectados con todos los elementos de la segunda. Estas conexiones que se mencionan tienen un peso. El peso será un parámetro que se podrá modificar en el modelo.

La idea de este algoritmo es encontrar los pesos adecuados de las conexiones existentes para conseguir la representación más correcta de los datos de entrada.

Mapas auto-organizativos-arquitectura

Red de aprendizaje: nodos rojos

Vectores de entrenamiento: verde

El algoritmo SOM

El algoritmo SOM se encuentra dividido en 5 etapas:

  • Etapa 1: Asignación a cada nodo un vector de peso aleatorio Wj
  • Etapa de competición: se escoge para cada dato de entrada (Xi) el nodo j al que es más próximo por similitud. Para realizarlo se utiliza la distancia euclídea del dato Xi con cada uno de los vectores y una vez realizado el cálculo se escoge aquella neurona que se encuentre más próxima.

j=argmin∥xi−wj∥2(1≤j≤M)

  • Fase de cooperación: cuando ya conocemos los resultados de la etapa anterior se relaciona (vecinos) aquellos nodos Wk cuya distancia a Wj se ha concluido que es mínima. La función encargada de esa relación se denomina tasa de vecinidad (h=h(li−lk))que se encarga también de asignar los pesos en función de la distancia, cuanto más próximo, más peso y viceversa.

 

Por otro lado, se define la tasa de aprendizaje α. Esta tasa, va a depender del número de iteraciones que se especificará anteriormente en el argumento de la función SOM. De este modo, en cada iteración, α decrece desde 1 hasta 0.

 

  • Etapa de adaptación: en la que se procede a actualizar los vectores de pesos de los nodos vecinos.

wk=wk+αh(li−lk)(xi−wk)

  • Etapa 5: Se repiten los pasos 2, 3 y 4 hasta que se consiga la verificación de alguno de los criterios de parada. Estos criterios pueden ser: que se alcance el número máximo de iteraciones, o que cuando se hayan realizado varias iteraciones el cambio que se va produciendo en los vectores no sea importante.

Aplicaciones del algoritmo

El algoritmo SOM tiene diferentes usos, entre los que se puede mencionar:

Clustering: consiste en agrupar una serie de datos dados en un conjunto de entrada siguiendo diferentes criterios, de tal manera que cuando se finalice el proceso los datos que se encuentren en cada grupo (conglomerado) serán los más similares en cuanto a ese criterio definido.

Mapas auto-organizativos-clustering

Ejemplo: se observa una agrupación según la coloración de los cuadrados, que da como resultado 3 conglomerados

Visualización: es un agrupamiento que se realiza de forma ordenada y de este modo permite visualizar al conjunto de entrada y descubrir las características nuevas o relaciones que no se habían podido prever anteriormente, además también permite observar la evolución en el tiempo del conjunto de datos.

Clasificación: aunque el mapa no tiene en cuenta la etiqueta de clase o el tipo de cada vector de entrada, una vez finalizado el proceso sí que se podría asignar una especie de etiqueta a cada nodo y así clasificar datos desconocidos.

Interpolación de una función: se trata de ir asignando valores numéricos a cada nodo de la red de Kohonen.

Cuantización vectorial: consiste en la aplicación de una entrada continua a una salida que se encuentre discretizada, obteniendo a partir de un vector un vector más cercano de un conjunto previamente establecido.

 

Precisión del Mapa autoorganizativo Kohonen

Una vez se ha establecido el Mapa autoorganizativo Kohonen, es muy importante comprobar si la adaptación de los datos de entrenamiento ha sido la adecuada. Se toman como medidas de la calidad de estos Mapas autoorganizativos la precisión de la proyección y la preservación de la topología.

 

La medida de precisión de la proyección permite comprobar cómo se produce la adaptación de las neuronas a los datos.

 

La medida de preservación de la topología explica la manera en la que el SOM almacena el conjunto de datos. Es decir, esta medida considera la estructura del mapa autoorganizado.

Close Bitnami banner
Bitnami