Bases del diccionario onomasiológico computarizado
en el área de desastres
Gerardo Sierra Martínez
Instituto de Ingeniería, UNAM
México
Introducción
Quiero agradecer a los organizadores del IV Simposio Iberoamericano de Terminología el haberme invitado a presentar esta ponencia y, de esta manera, tener la oportunidad de compartir con ustedes las experiencias de un proyecto que se está elaborando en el área de Investigación Interdisciplinaria de Desastres del Instituto de Ingeniería, Universidad Nacional Autónoma de México (UNAM). Por esta razón, siempre serán bien recibidas las aportaciones de ustedes, ya sean preguntas, comentarios o sugerencias.
Si bien los trabajos terminológicos son multidisciplinarios, este proyecto es interdisciplinario y a la vez, aunque parezca contradictorio, unidisciplinario, esto es, el terminólogo, lexicógrafo, computólogo y desastrólogo es la misma persona. Es evidente que por falta de equipo de trabajo el proyecto se haya atrasado, aunque a lo largo de cinco años se han obtenido buenos avances, de los cuales tengo el gusto de presentar ahora algunos.
El proyecto busca lograr tres objetivos, el primero de los cuales consiste en elaborar un glosario de términos en el área de teoría de desastres. Este objetivo en un principio era muy sencillo, ya que se iba a partir de un corpus limitado a unos 300 términos, obtenidos en gran parte de algunos glosarios existentes. Posteriormente, con la búsqueda de otras fuentes y con el fin de tener un trabajo más rico, se decidió ampliar el corpus, llegando a unos 1.000 términos. Por la falta de equipo de trabajo, estoy en el dilema de continuar con el glosario extendido o regresar al corpus inicial. De cualquier forma, por el momento no hablaré de este primer objetivo3, sino sobre el segundo y el tercero, que están enfocados, respectivamente, a la elaboración del diccionario onomasiológico con la metodología correspondiente, y al diseño del programa de cómputo que permita el empleo del glosario y del diccionario onomasiológico.
Voy a iniciar con el tercer objetivo, describiendo la arquitectura del programa de cómputo, y terminaré la ponencia con la exposición de la metodología empleada en el diccionario onomasiológico, con base en un ejemplo.
Con el fin de simplificar los términos, usaré glosario para el glosario en el área de desastres, que permite la búsqueda semasiológica, esto es, cuando a partir de un término dado se obtiene la definición; diccionario para referirme al diccionario onomasiológico, que en contraste con la anterior búsqueda parte del concepto para tratar de llegar al término; y sistema para el mismo programa de cómputo.
Arquitectura del programa de cómputo
Antes de describir el sistema, conviene definir algunos términos. Se tiene, en primera instancia, el término como el significante de un concepto dado; los sinónimos como los distintos términos que expresan un mismo concepto; la definición o significado del término; las palabras clave, que son las palabras significativas que integran la definición (evidentemente, algunos términos están contenidas en esa definición y por supuesto también son palabras clave).
Una vez descrita la arquitectura del programa de cómputo, sintetizada en la figura 1, expondré, en la segunda parte, el significado de las palabras clave y cómo se precisan.
El programa se puede considerar como un sistema en el que se introducen como entrada ciertos datos para obtener como salida otros datos. Si el usuario introduce como dato un término, a través del glosario, entonces el programa, como resultado del proceso que describiré más adelante, proporciona la definición del término. Por el contrario, en el diccionario, el usuario mete como datos las palabras que describen un concepto determinado y el programa da como resultado una lista de los términos usados para designarlo. Además, una vez que se encontró un término en el diccionario, se puede inmediatamente conocer cuál es la definición del mismo recurriendo al glosario.
Por ello, cuando el usuario accede al programa de cómputo, lo primero que debe hacer es definir si quiere entrar al glosario o al diccionario. Una vez definido, el programa pide una serie de datos.
En el caso del glosario, el dato que se pide es el término del que se quiere buscar su definición. El sistema acepta como entradas válidas de un término a sus sinónimos y variantes gramaticales (género y número), y no necesariamente el término preciso. Entonces, el programa realiza una búsqueda individual de las palabras introducidas en una base de datos, TER-SIN, conformada por los términos y sus sinónimos.
Como ejemplo, se puede encontrar la definición del término "calamidad", introduciendo "calamidades", o "fenómeno(s) destructivo(s)", ya que todos se refieren al mismo concepto. En cualquier caso, en la salida el sistema indicará la sinonimia entre ambos términos. Como es de todos conocido, un glosario tradicional, por economía del papel, diría "véase calamidad".
En la base de datos TER-SIN, el sistema identifica los términos conocidos y desconocidos. Si no conoce alguno, le dice al usuario que ese término no está en el glosario. En caso de conocerlo, entonces busca este término en la siguiente base de datos, TER-DEF, que contiene los términos con sus definiciones y sinónimos. Con esto, el sistema proporciona como resultado el término, su definición y sus sinónimos.
Considerando que algunas veces se pueden hallar, en la definición, términos que a su vez se definen en el glosario, el sistema permite, mediante hipertextos (capacidad de algunos programas de cómputo para acceder al significado de ciertos términos selectos dentro de un texto), seleccionar cualquiera de esos términos para encontrar su definición, de manera tal que esta definición puede contener, a su vez, otros términos de hipertexto con sus respectivas definiciones. Así, este proceso, tradicional en un glosario y que resulta tedioso, se vuelve sencillo y se ejecuta de inmediato a través del sistema.
Ahora bien, en cuanto al diccionario, que permite encontrar el término más cercano a un concepto dado, lo que se introduce como entrada al sistema es el concepto, a través de las ideas con que se cuenta. Evidentemente, las ideas están expresadas por medio de palabras, algunas de las cuales resultan significativas para el programa de cómputo. Estas palabras significativas las denomino palabras clave.
Todas aquellas palabras que no son significativas para el sistema simplemente las desecha, en tanto que las palabras que resultan significativas las identifica.
De igual manera que en el glosario, se permite la posibilidad de reconocer sinónimos o variantes de la palabra clave. Las variantes, en este caso, no sólo son morfológicas, sino semánticas. Ejemplos de estas variantes los mencionaré más adelante.
En el programa, una vez identificadas las palabras clave, se les ubica en lo que denomino paradigmas, basándome en el sentido de relaciones paradigmáticas. Un paradigma es un conjunto de palabras clave asociadas, de las que se distingue una, denominada líder, con la cual se prosigue al siguiente proceso.
El conjunto de los paradigmas integra una base de datos, LID-ASO, formada por el líder y las palabras clave asociadas.
Entonces, lo primero que se hace es identificar, a nivel exclusivamente de cómputo, transparente para el usuario, los líderes de los paradigmas.
Una vez identificados los líderes pasa a la siguiente base de datos, LID-TER, la cual registra en qué término aparece cada uno de los líderes. Posteriormente, hace un análisis de frecuencia de los términos en los que aparecen los líderes. Con este análisis de frecuencias, el sistema da como resultado una lista con la serie de términos más probables, en forma decreciente, de tal manera que aparecerá en primer lugar el término que contiene más líderes.
Hay que considerar que el resultado no es único, dado que es difícil precisar exactamente un sólo término para designar varias palabras clave, las cuales normalmente están contenidas en varios conceptos. Por eso, se incluye una lista de los términos más probables, entre los cuales seguramente aparece el buscado.
Conviene también recordar que del diccionario se puede pasar al glosario. Así, cuando el usuario obtiene la lista de términos en el diccionario, puede buscar la definición de cualquiera de ellos, accediendo al glosario, o si lo desea puede continuar la búsqueda en el diccionario precisando más palabras clave. Con la definición, el usuario puede ir en el glosario por medio de hipertextos a buscar otras definiciones.
Selección de palabras clave
Una vez conocida la estructura del sistema, me gustaría ir a la segunda parte, sobre cómo se precisaron estas palabras clave, a través de un ejemplo. Voy a partir de la clasificación de calamidades que se identifican en México por el Sistema Nacional de Protección Civil, a nivel federal.
Se tiene una clasificación en cinco grupos, a saber: calamidades hidrometeorológicas, geológicas, físico-químicas, sanitarias y sociorganizativas. El ejercicio que expongo se aplica exclusivamente a las calamidades geológicas.
En la tabla 1 presento, en la línea superior, la lista de las calamidades geológicas: colapso de suelos, deslizamiento de talud, erosión, vulcanismo, hundimiento regional, sismo y maremoto. Lo que se tiene en cursivas mayúsculas serían los líderes de los paradigmas. Lo demás es simplemente la liga entre los líderes, a fin de comprender más fácilmente la secuencia de palabras como una definición.
| COLAPSO DE SUELOS |
DESLIZAMIENTO DE TALUD |
EROSIÓN |
VULCANISMO |
HUNDIMIENTO REGIONAL |
SISMO |
MAREMOTO |
| CALAMIDAD |
| GEOLÓGICA |
| que consiste en |
| DERRUMBE |
DESGASTE |
EXPULSIÓN |
REACOMODO |
DESACOMODO |
OLEAJE |
| SÚBITO |
|
GRADUAL |
SÚBITO |
GRADUAL |
SÚBITO |
| de o en |
| SUELO |
MAGMA |
SUELO |
PLACAS |
MAR |
| SUPERFICIAL |
CORTEZA |
BLANDO |
CORTEZA |
| debido a |
| CARGA |
NATURALEZA |
SISMO |
EXTRACCIÓN |
ESFUERZOS |
SISMO |
| HOMBRE |
FREÁTICO |
VULCANISMO |
Así se tiene, por ejemplo, que colapso de suelos es una calamidad geológica que consiste en el derrumbe súbito del suelo superficial debido a la carga propia; o bien, el vulcanismo es una calamidad geológica que consiste en la expulsión súbita de magma de la corteza terrestre debido a sismos.
Conviene en este momento advertir dos cosas. Primero, los líderes no son exhaustivos, esto es, no proporcionan la definición completa. Segundo, los líderes son subjetivos y no necesariamente representativos de las palabras clave asociadas, sino más que nada para seguir este proceso, dentro de las bases de datos. Se buscó tener el menor número de paradigmas porque, evidentemente, a mayor número de paradigmas, el sistema es más complejo. Además, los paradigmas integran el mayor número de palabras asociadas al término líder.
Se puede apreciar en la tabla que un líder, como el caso de "súbito" y "gradual", puede encontrarse en varios términos, de tal forma que un líder normalmente no pertenece a un sólo término, sino que se encuentra en varios de ellos.
Ahora, por ejemplo, el líder "súbito" no solamente encierra el concepto "de repente" sino que también tiene más significados dentro de este paradigma. Si pensamos en colapso de suelos, nos daremos cuenta que éste es súbito, violento, repentino, por lo que esta serie de palabras asociadas pertenecen al mismo paradigma.
Ahora voy a dar algunos ejemplos de los paradigmas. Iniciaré con calamidad, que además de ser líder es un término. El paradigma calamidad debe contener, al menos, los sinónimos, a saber, fenómeno destructivo y agente perturbador. Asimismo, para el caso en que no se tiene la palabra del todo precisa, es decir, cuando la tenemos algo borrosa, el programa debe considerar las variantes de estos sinónimos. Para fenómeno(s) destructivo(s,a,as), cabe la posibilidad de escribir manifestación(es) destructor(es,a,as), devastador(es,a,as) y desastroso(s,a,as). Para agente(s) perturbador(es), se tiene evento(s), suceso(s) o acontecimiento(s) calamitoso(s). Además, hay que entender el concepto calamidad como lo que destruye(n), devasta(n) o perturba(n).
Al preguntarle a varias personas sobre el concepto que tienen de sismo, normalmente todos omiten que se trata de una calamidad geológica. Sin embargo, como este es un glosario estructurado, hay que ver que se nos escape lo menos posible. Si no se considera que el sismo es un fenómeno destructivo, entonces se está pasando por alto un dato muy importante. Con esto puede observarse que la conceptualización de paradigmas permite identificar o ver los términos que están asociados a un término dado, a la vez que ayuda a definir el mismo término.
Continuando con las palabras clave, quiero mencionar el caso de magma, que es un líder dentro de la definición de vulcanismo, en donde se refiere a la expulsión de magma. Lógicamente, aquí el líder magma encierra otras palabras que también se pueden expulsar de un volcán, como es el caso de lava, fuego, rocas, cenizas, gases, vapor y fumarolas. Por lo tanto, no vale la pena hacer un paradigma a cada una de ellas, ya que magma encierra a su vez las otras posibilidades.
Finalizo con otro caso en el que una misma palabra clave, como es movimiento, se puede encontrar en varios paradigmas. En caso de colapso de suelos, el movimiento se puede precisar como un derrumbe o un desplome; para el fenómeno de vulcanismo, el movimiento es la expulsión o la erupción; para el sismo, éste es desacomodo o ruptura. Por ello, al introducir una palabra clave muy general, como el caso de movimiento, se tendrá como resultado de la búsqueda a varios términos; en caso de ser más precisa la palabra clave, entonces el resultado será, consecuentemente, más preciso.
Conclusiones
Como podrá observarse, la ventaja que se tiene con el sistema es su amigabilidad, comodidad y flexibilidad para el usuario.
La metodología de las palabras clave es aplicable a cualquier terminología, no sólo en el área de desastres. Las palabras clave permiten estructurar el diccionario onomasiológico, precisar las definiciones de los términos y tener a la vez una terminología más estructurada y completa.
El programa puede realizar tanto la búsqueda semasiológica como la onomasiológica. En la primera se busca la definición de un término dado, en tanto que en la segunda se busca el término que designa un concepto determinado.
En el diccionario onomasiológico, si ustedes se dan cuenta, la flexibilidad de las palabras clave y agilidad en la búsqueda sólo es factible a través de un programa de cómputo: hacerlo en papel, simplemente sería imposible. Además, el programa es flexible y cómodo al usuario, ya que permite introducir ideas o conceptos, más que palabras frías.
Para terminar, quiero agradecer su atención y anticipadamente darles las gracias a todos aquellos que quieran aportar sus ideas, ya que les recuerdo que este es un trabajo en el que todavía falta mucho por hacer. Muchas gracias.
|