|
Mapas autoorganizativos de Kohonen
para la representación del conocimiento
Arilog Regina Pabón Angel
arilog@hotmail.com
Vanessa Diossa Arango
vandiossa@yahoo.com
Facultad de Ingeniería
Universidad de Antioquia
Medellín
Colombia
Resumen
Actualmente, existe una cantidad importante de información documental disponible en formato digital, el acceso a esa información presenta el problema de encontrar un documento específico para satisfacer los requerimientos del usuario, por lo que se hace necesario desarrollar métodos de búsqueda de información que sean más efectivos y útiles. Usando una técnica basada en redes neuronales artificiales como los "Mapas Auto-organizativos de Kohonen" (SOM), se pueden crear mapas bidimensionales, en el que dos contenidos que estén relacionados aparecerán juntos, y cuanto más similar sean dos documentos, más próximos estarán en el mapa [1]. La clasificación automática de documentos generada, permite al usuario clasificar e interpretar los documentos y navegar por el mapa, facilitando así, el análisis de información, el trabajo terminológico y la gestión documental.
1 Introducción
En la actualidad existe gran variedad de información documental electrónica proveniente de diversas áreas del saber, información que con el aumento de investigaciones, búsquedas en Internet y procesos generales de gestión documental que involucran la digitalización, incrementa su volumen rápidamente haciendo difícil su localización.
Con el ánimo de encontrar información específica las personas realizan procedimientos manuales de organización y categorización de documentos, los cuales se vuelven lentos y dispendiosos por el volumen de información a tratar.
Una solución a este problema es la técnica de los mapas de autoorganización útiles para la asociación de documentos representados como vectores. La autoorganización está basada en redes neuronales y forma parte de la inteligencia artificial.
Mediante la utilización de esta técnica se aprovechan las relaciones existentes entre los documentos y la información que nos proporciona el mapa, además de las relaciones entre palabras, para categorizar documentos, agilizar procesos de gestión documental, análisis, recuperación y transferencia de información.
2 La Representación del conocimiento
El conocimiento es un activo intangible, estratégico, volátil, difícil de concretizar y conservar, que debe expresarse mediante una representación física para hacerse tangible y así ser adquirido, clasificado, conservado y explotado. Con este fin en todos los ámbitos se hacen esfuerzos y se asignan recursos en forma creciente para definir cómo adquirirlo, representarlo, capitalizarlo, y administrarlo.
En las organizaciones a menudo se utilizan métodos o instrumentos de comunicación de información que impiden una rápida y abierta transmisión del conocimiento. De ahí la importancia de editar y difundir los documentos en formato digital de manera rápida, puesto que los documentos digitalizados, presentan unas características dinámicas que carecen los documentos en papel y facilitan al usuario el acceso a la información que necesita. El documento digitalizado es entonces información potencial que puede transformarse en nuevo conocimiento, su misión es transmitir la información acumulada y permitir que el lector analice, explique, mida, interprete o resuma su contenido.
En el proceso de digitalización, la transformación de documentos contribuye en gran medida al aumento exponencial de la información y al desarrollo de información electrónica que puede ser manipulada por medios automáticos. Para acceder a tal cantidad de información y contribuir con los procesos de gestión del conocimiento sorteando dificultades como el ruido e interferencia que impiden la recuperación directa de un documento específico, se han estudiado distintos mecanismos en el sentido de la representación documental para establecer relaciones entre documentos y contribuir con la recuperación oportuna y eficiente de la información, ya que a través de la información organizada se transmite el conocimiento generado en los diferentes ámbitos del que hacer humano.
El proceso de representación del conocimiento consiste en tomar el conocimiento extractado de las fuentes estáticas y dinámicas y llevarlo a una forma entendible. El proceso se realiza en paralelo con el de adquisición del conocimiento. Inicialmente la representación que hace el documentalista la debe hacer en forma manual, mediante la documentación
Cuando el documentalista o el terminólogo registran el conocimiento adquirido de alguna forma, comienzan a realizar su representación.
Para los sistemas de conocimiento las formas de representación estándar son: la lógica proposicional, la lógica de predicados, las reglas de producción, las redes semánticas, los marcos (frames), los guiones (scripts), los lenguajes orientados por objetos y las redes neuronales, entre otros.
Las redes neuronales tratan de imitar la mecánica del cerebro humano, de unidades interconectadas. El modelo tiene muy pocas variables: el número de neuronas, el número de conexiones de entrada y salida de cada una, y el carácter de activa o inactiva de cada conexión, estas variables se combinan en infinitas formas para generar en algunos casos mecanismos de recuperación de información, que se engloban en técnicas de asociación de términos y técnicas de asociación de documentos.
Las técnicas de asociación de documentos facilitan recuperar un registro o documento utilizando medidas de similaridad, que se aplican a dos documentos analizando la frecuencia de las palabras en ambos. Por su parte el clustering utiliza la técnica de agrupación de registros similares en grupos, formando así una representación del documento.
En cuanto al propósito de la Recuperación de Información como mecanismo, se buscan gestionar inmensas cantidades de datos para facilitarlas al usuario como respuesta a sus necesidades de información. El resultado ideal sería una visualización ordenada de los documentos por utilidad o relevancia ante una determinada petición, y que esta fuera similar a la que hicieran los usuarios si pudieran examinar todos los documentos disponibles.
Durante el estudio de las diferentes técnicas para la representación del conocimiento se concluyó que las redes neuronales generan una representación simple y clara de grandes grupos de documentos además de ser sistemas eficientes de clasificación documental.
Para la aplicación de los mapas autoorganizativos de Kohonen (redes neuronales competitivas no supervisadas) al conjunto de documentos, se deben seguir los siguientes pasos:
1.- Se eliminan los diacríticos (acentos, diéresis, tildes, entre otros), para estandarizar términos. También se eliminan las palabras poco significativas pertenecientes a categorías como artículos, pronombres, proposiciones, conjunciones, determinantes, contracciones e interjecciones gramaticales, para disminuir el rango de error, y además se eliminan las palabras de alta y baja frecuencia con el fin de reducir el procesamiento computacional y eliminar ruido.
2.- Con estas palabras se genera un mapa de categorías de palabras (Word Category Map) el cual se forma clasificando los términos con una red de Kohonen.
3.- Se construye un histograma para cada documento indicando el número de palabras que cada categoría contiene.
Las salidas o resultados de la categorización o agrupamiento de los documentos asociados brindan las siguientes ventajas:
Sirven de apoyo en la toma de decisiones.
Ayudan al usuario a solucionar problemas específicos de información.
Proporcionan una imagen global de la estructura y los tipos de contextos existentes en una base de datos lingüística o documental.
Proporcionan un método de selección de un grupo de términos lingüísticos o documentos de interés.
Facilitan el trabajo de los clasificadores o indizadores humanos que pueden buscar relaciones entre los documentos o términos que se proyectan en unidades del mapa.
Sirven para identificar patrones válidos que puedan ser utilizados en implementaciones prácticas de análisis y minería de datos textuales.
3 Las Redes Neuronales Artificiales (RNA)
Dentro de la Inteligencia Artificial las técnicas de RNA con aprendizaje no supervisado se presentan a priori como una herramienta ideal para interpretar las necesidades de búsqueda de un usuario y ofrecer las mejores respuestas en función de algún procesamiento de la información existente y de las peticiones de búsqueda, ya que son capaces de agrupar y clasificar documentos de forma completamente automática en función de los contenidos globales.
Las RNA establecen una metáfora del sistema nervioso y de su unidad fundamental, la neurona.
Una neurona consta de tres elementos: un cuerpo celular, unas dendritas y un axón que termina en las conexiones sinápticas. Esquemáticamente los impulsos de otras neuronas llegan a las dendritas, si estos impulsos son suficientes se produce la activación de la neurona que transmite su impulso por el axón hasta las conexiones sinápticas.
 Esta simplificación es excesiva, pero suficiente para modelar una neurona artificial. En este caso bastará saber que las dendritas reciben los impulsos de otras neuronas y que si la suma de esos impulsos es superior al “umbral de activación” la neurona propagará la señal hacia las neuronas con las que está conectada. En una RNA el equivalente a la neurona es el “elemento de proceso”. Este elemento es una simplificación de la neurona biológica
Las RNA son, básicamente, una tecnología computacional y por lo tanto pueden utilizarse en cualquier campo susceptible de operativizar sus problemas computacionalmente, son consideradas como una valiosa herramienta capaz de ser aplicada con buenos resultados a cualquier campo, incluidos los factores humanos y la interacción hombre-ordenador.[1]
3.1 Mapas Auto-Organizativos de Kohonen
Dentro de las RNA se pueden crear dos grandes grupos en función del tipo de supervisión de su aprendizaje. Si la red recibe información sobre si su funcionamiento es correcto o incorrecto, basándose en alguna medida de error entre la salida de la red y la salida deseada, entonces estamos hablando de sistemas supervisados. Si por el contrario la red no recibe ningún tipo de información entonces hablamos de sistemas no supervisados. En este último grupo los modelos buscan a partir de unos datos extraer propiedades, características, relaciones, regularidades, correlaciones o categorías existentes en ellos. Los mapas Auto-Organizativos de Kohonen son un tipo de red no supervisada.
Una propiedad del cerebro es que las neuronas están ordenadas significativamente. Esto implica que estructuras idénticas en el cerebro funcionan de forma diferente debido a su diferente topología cerebral. Otra propiedad básica es su inhibición lateral, cuando una neurona se activa, esta produce un estado excitatorio en las células más cercanas y un efecto inhibitorio en las más lejanas [1].
En 1982 Kohonen propuso el mapa de características de Kohonen, motivado por la idea de que “la representación del conocimiento en una particular categoría de cosas en general debiera asumir la forma de un mapa de características organizado geométricamente sobre la parte correspondiente del cerebro”. [infovist]
Este modelo de red neuronal con capacidad para formar mapas de características de manera similar a como ocurre en el cerebro, intenta simular los mapas topológicos de los fenómenos sensoriales y motores existentes en el cerebro, a través de una organización matricial de neuronas artificiales.
Una de las propiedades importantes del cerebro es el significativo orden de sus unidades de proceso. Este orden hace que unidades estructuralmente idénticas tengan una diferente funcionalidad debida a parámetros internos que evolucionan de forma diferente según dicha ordenación de las células. Esta propiedad parece ser de fundamental importancia para la representación de imágenes visuales, abstracciones, etc.
La estructura topológica de la red absorbe a su vez aquella que se produce entre las características de los datos, y por tanto el sistema no es solo capaz de realizar una clasificación de los estímulos, sino que además nos pondrá de relieve y conservará las relaciones existentes entre las diferentes clases obtenidas.
El objetivo de Kohonen era demostrar que un estímulo externo (información de entrada) por sí solo, suponiendo una estructura propia y una descripción funcional del comportamiento de la red, era suficiente para forzar la formación de mapas topológicos de las informaciones recibidas del exterior.
Este modelo en una de sus variantes (Self Organizing Maps) trata establecer una correspondencia entre los datos de entrada y un espacio bidimensional de salida, de modo que ante datos con características comunes se activen neuronas situadas en zonas próximas de la capa de salida. Cada neurona de la capa de entrada está conectada con cada una de las neuronas de la capa de salida mediante pesos
Las interacciones laterales siguen existiendo en relación con la distancia que se toma como una zona bidimensional alrededor de la neurona.
 Se presenta, entonces, a la entrada una información en forma de vector de N componentes (la capa de entrada tiene N neuronas) Las M neuronas que forman la capa de salida reciben la información a través de conexiones hacia delante con pesos wji y también a través de las conexiones laterales con el resto de las neuronas de la capa de salida, de manera que la red evoluciona hasta encontrar una situación estable en la que se activa una neurona de salida, esta es la vencedora. Una vez encontrada la vencedora, los pesos se actualizan, no sólo para la vencedora, sino para todas las de su vecindario.
La regla de competición lleva los vectores de pesos hacia la entrada actual, como la vencedora y sus vecinas se actualizan en cada paso, todas ellas se mueven hacia la misma posición, aunque las vecinas lo hacen más lentamente a medida que la distancia aumenta. Esto organiza las neuronas de modo que las que están en un entorno comparten la representación de la misma área del espacio de entradas, independientemente de su localización inicial. [4]
3.2 El proceso 
Se trata de un sistema que permite ordenar automáticamente documentos, con el fin de facilitar su exploración y navegación. Para ello utiliza un método que consta de los siguientes pasos:
1. Se toman los documentos y se elimina la información no textual.
2. Se desestiman aquellas palabras que presentan una baja y alta ocurrencia y son tratadas como entradas vacías.
3. Se eliminan las palabras comunes que dificultan la discriminación temática.
4. Utilizando un SOM se genera un primer mapa de categorías de palabras. Estas son ordenadas de manera que las palabras que tienden a aparecer en el mismo nodo, forman la misma categoría.
5. Este mapa es utilizado para filtrar la información de los documentos. Con la información filtrada y difuminada, utilizando SOM nuevamente se genera un segundo mapa, el mapa de documentos.
De esta forma, el producto final es un mapa, donde cada documento ocupa un lugar en el espacio en función de sus contenidos temáticos, en el que dos contenidos que estén relacionados aparecerán juntos, y cuanto más similar sean dos documentos más próximos estarán en el mapa.[3]
4 Conclusiones Los resultados obtenidos con este trabajo facilitan al usuario tareas en las que no tenga buen dominio del tema o solo tenga una vaga idea del contenido de los documentos que van a ser examinados. Ya que el mapa asocia los documentos de acuerdo a su contenido (recuperación cognitiva de información) posibilitando también hallar un documento especifico, dado que los mapas permiten la visualización de información documental en forma intuitiva.
Estudios de usabilidad indican que cuando se sabe el documento que se busca resultan más útiles los sistemas tradicionales, sin embargo cuando se trata de hojear o para tener una idea global del contenido en general de un conjunto de documentos los mapas de categorías de palabras y los de documentos pueden ser apropiados.
Los mapas auto organizativos de Kohonen realizan un análisis y categorización automática del contenido semántico de documentos textuales, siendo así que los mapas son una alternativa mas de las que están floreciendo con el objetivo de hacer más dirigible la representación de grandes conjuntos de información textual.
5 Referencias
[1] Castellanos Miguel Angel y Pedro Concejero. 1999. Introducción a las Redes Neuronales y su aplicación a las Búsquedas de documentos, Grupo Factores Humanos Telefónica I+D, Madrid, URL:
http://www.tid.es/presencia/boletin/bole19/art002.htm.
[2] Dürsteler Juan C. 2001. Mapas de Kohonen. La revista digital de InfoVis.net, URL: http://www.infovis.net/Revista/num_39.htm
[3] Honkela Timo, Samuel Kaski, Krista Lagus, and Teuvo Kohonen. 1996. Newsgroup exploration with WEBSOM method and browsing interface, in Technical Report A32, Helsinki University of Technology, Laboratory of Computer and Information Science, Espoo, Finland.
[4] Kohonen Teuvo. 1998. Self -organization of very large document collections: State of the art, In Niklasson, L., Bodén, M., and Ziemke, T., editors, Proceedings of ICANN98, the 8th International Conference on Artificial Neural Networks, volume 1, pp. 65-74, Springer, London
|