Actas / Atas
1988-2002
Presentación / Apresentação
I Simposio (1988)
II Simpósio (1990)
III Simposio (1992)
IV Simposio (1994)
    Índice
V Simposio (1996)
VI Simposio (1998)
VII Simpósio (2000)
VIII Simpósio (2002)
Índice por autores

 

 

Aplicación de las bases de datos orientadas a objetos
a los trabajos terminológicos

Enrique De los Ríos Porras
Sonia Gómez Fernández
Susana M. Ferrándiz Martín
Mercedes Pol de la Escalera
CINDOC-CSIC
España

 

Introducción

Durante nuestra experiencia como terminólogos hemos tenido la oportunidad de crear, alimentar y utilizar bases de datos (BD) terminológicas. Su importancia es manifiesta pues constituyen un instrumento de ayuda indiscutible al traductor y un elemento de normalización de la lengua de especialidad.

Por ello es preciso llevar a cabo una continua investigación en el desarrollo de estas bases de datos, ya que su perfeccionamiento y su mejor aprovechamiento repercuten directamente en la rentabilidad de los servicios de traducción y por supuesto en la conservación de la pureza lingüística.

Este documento pretende presentar a las bases de datos orientadas a objeto (BDOO) como posibles candidatas a ser soporte de los bancos de datos usados en terminología (bancos terminológicos). Para ello vamos a exponer el por qué de esta propuesta, así como las ventajas que comporta el adoptar este nuevo soporte.

 

El sistema de gestión terminológica

Antes de pasar a detallar nuestra propuesta merece la pena detenerse en aclarar nuestro punto de vista respecto a la gestión y uso de una BD terminológica.

Parece natural que un Sistema de Gestión Terminológica (SGT) este constituido por dos entidades que se relacionan entre sí: la entidad gestora y la entidad usuario.

Entidad gestora

Se encarga de la gestión y mantenimiento de la base de datos terminológica. Al mismo tiempo proporciona soporte para la evolución de los términos. Físicamente se compone de una base de datos, un interfaz con la red de comunicaciones para el acceso de los usuarios de ésta, así como una unidad de acceso y mantenimiento de la base de datos. A la base de datos física junto con la entidad de acceso y mantenimiento la llamamos Sistema de la base de datos.

Entidad usuario

Esta entidad realiza las siguientes acciones en función de sus necesidades:

Acceso a la base de datos de la entidad gestora.

Navegación en la base de datos (serie de búsquedas condicionadas dentro de una misma sesión).

Obtención de la información deseada.

La entidad usuario físicamente comprende a los usuarios finales de la base de datos. El acceso a la entidad gestora se realiza por medio de una red de comunicaciones que puede ir desde una conexión directa de un terminal a los más sofisticados medios (red telefónica, red de datos X.25, ISDN, B-ISDN, INTERNET, VIDEOTEXT, correo electrónico, etc.)

Estas dos entidades se relacionan entre si determinando cada una de ellas características y funciones de la otra. Así, por ejemplo, la elección de un soporte en la base de datos de la entidad gestora va a condicionar el modo de acceso a ésta que pueda hacer la entidad usuario. Igualmente, si la entidad usuario necesita, por ejemplo, un tiempo medio determinado de acceso a la base de datos, no tenemos más remedio que inclinarnos por la elección de un tipo de base de datos que lo permita en la entidad gestora.

Por otro lado, cada una de estas dos entidades puede tener requerimientos distintos que exigir a la base de datos, pues sus necesidades frente a ésta son distintas.

En este trabajo nos vamos a centrar en las repercusiones que conlleva el optar por una base de datos orientada a objetos como base de datos de la entidad gestora.

 

Problemas de las bases de datos terminológicas actuales

Se pueden identificar diferentes problemas y/o retos que son comunes hoy día a las bases de datos terminológicas, a saber:

1. Lenta velocidad de respuesta frente a una interrogación en concreto o dentro de una navegación.

2. Respuesta imprecisa de la entidad gestora.

Aquí podemos distinguir dos aspectos:

Se da como respuesta un conjunto elevado de posibles respuestas que nos crean más problemas de los que intentamos resolver.

Preguntas sin respuesta, aunque potencialmente la base de datos podría darla. Problemas de gestión y acceso.

3. Lagunas de las bases de datos.

La base de datos no contiene respuesta alguna aunque su gestión sea adecuada. Este hecho esta relacionado con aspectos de actualización.

4. Rígida organización de los términos en la base de datos.

Los términos se encuentran clasificados en función de pocos criterios de acceso (vistas). Se ha de intentar facilitar las búsquedas mediante múltiples vistas. Es decir considerar entornos de aplicación de términos con relaciones entre ellos diferentes según el entorno.

5. Actualización compleja.

La inserción/modificación de los términos así como un rediseño de los registros (fichas) son operaciones complejas que consumen recursos y tiempo en las bases de datos tradicionales a veces con riesgo de pérdida de información. Por lo tanto, se ha de facilitar la inserción de nuevos términos así como su reorganización sin riesgo a perder los datos y la relación entre éstos, es decir, se ha de contar con una alta consistencia e integridad de los datos.

6. No existencia de formatos estándar para la transmisión de datos.

A veces no es posible la transferencia directa de información entre bases de datos por incompatibilidades de formato. Se ha de facilitar la integración de la información obtenida por la entidad usuario en la entidad gestora y entre bases de datos de entidades usuario distintas.

7. Poca riqueza semántica de las bases de datos tradicionales.

Un término, generalmente, representa a más información de la que se introduce en una ficha terminológica tradicional. La ficha terminológica, es decir la información que tenemos del término, ha de evolucionar y acercarse al mundo real para poder así captar mejor al objeto que se intenta representar enriqueciendo el concepto de termino. Esto se puede hacer incorporando relaciones múltiples y complejas entre términos, texto en múltiples formatos y alfabetos, gráficos, sonido, imágenes, video, etc.

8. No existencia de criterios objetivos de clasificación de términos.

Tanto para buscar una información concreta en una base de datos como para navegar por ella, lo más adecuado es contar con "mapas" donde queden definidas las relaciones entre términos. Es deseable el contar con procedimientos objetivos de medida (métricas) entre términos que nos ayuden a eliminar las ambigüedades de las relaciones entre éstos y nos permitan establecer criterios de "distancia" entre los mismos.

 

Las bases de datos orientadas a objeto

El concepto de "objeto" al que nos vamos a referir se hereda directamente de los llamados lenguajes de programación orientados a objeto (LPOO).

Los LPOO surgieron a finales de la década de los 80 como un intento de resolver problemas de alta complejidad a los que la programación tradicional (estructurada) no daba una respuesta satisfactoria.

Los datos en los LPOO se organizan igual que los objetos que forman el mundo real con sus misma estructura interna y manteniendo la relación con los demás objetos del entorno.

Un objeto tiene en una sola entidad y con un único nombre, las estructuras de datos, las acciones (procedimientos y funciones) que actúan sobre esos datos, así como, y lo que es más importante en su aplicación a la terminología, la relación con otros objetos.

En general cualquier sistema de bases de datos se distingue de otros programas por su habilidad de manejar datos persistentes y por la capacidad de acceder a estos datos de un modo eficiente y seguro. Otras características comunes deseables de una base de datos son:

Soporte para modelos abstractos de datos.

Soporte para accesos de alto nivel o lenguajes de interrogación.

Soporte para gestión de transacciones en un entorno multiusuario.

Soporte para controles de acceso y propiedad de datos.

Soporte para validación de datos y chequeos de consistencia.

Soporte para recuperaciones de datos en caso de fallos de sistema minimizando la pérdida de datos.

Las Bases de Datos Orientadas a Objetos (BDOO) nacen a principios de la década de los noventa como una evolución de las bases de datos "tradicionales" hacia una mejor relación con el mundo real captando la mayor cantidad posible de conocimiento (semántica) del mismo aprovechando la naturaleza de los objetos dentro de los LPOO.

Un sistema de BDOO, es una base de datos con las propiedades generales de estas y cuyos elementos constitutivos son a su vez objetos.

Si intentamos definir el objeto del que estamos hablando sin caer en muchos tecnicismos, nos encontraremos con el mismo problema que al intentar definir un objeto del mundo real, es decir un objeto puede ser prácticamente "cualquier cosa", en nuestro caso un objeto puede ser cualquier estructura de datos que podamos concebir. Además, dentro del objeto se incluyen sus relaciones con otros objetos que están dotadas de enorme flexibilidad (pertenencia, inclusión, "padre", "hijo", "amigo", etc.). Esta flexibilidad a la hora de definir la estructura del objeto y a la hora de establecer sus relaciones junto con otras características que veremos, otorgan un enorme potencial a las BDOO cuando los elementos a almacenar son complejos como es el caso de los términos.

 

Ventajas del uso de las BDOO en un sistema de gestión terminológico

Los principales beneficios que se obtienen de las bases de datos orientadas a objetos son:

Una BDOO minimiza los accesos a memoria en busca de los objetos buscados.

En las BDOO no existen ficheros de índices que recorrer cada vez que hacemos una búsqueda, lo que supone un importante ahorro de memoria y de tiempo.

Las BDOO ayudan a disminuir el salto semántico entre los objetos del mundo real que pretendemos estudiar, los términos, y su representación en la base de datos.

Los objetos son hoy día las entidades informáticas que mejor capturan al mundo real ya que pueden captar tanto su naturaleza (texto, imagen, sonido, etc.) como sus relaciones con el entorno (pertenencia a clases, dependencias, identidad, etc.).

Es posible almacenar tanto las relaciones entre los objetos como las restricciones entre los objetos.

Una propiedad fundamental de los objetos es la encapsulación, es decir la habilidad de filtrar estructuras de datos de modo que su interrelación con el exterior se hace por medio de interfaces explícitamente definidos y donde es posible ocultar o privatizar determinada información.

Las BDOO ofrecen métodos de acceso, navegación e interrogación ad hoc, comparado con otros modelos de bases de datos.

La propia naturaleza del objeto donde se contienen sus relaciones con su entorno facilita su relación con éste. Las BDOO son sin duda unos excelentes soportes para la navegación (por ejemplo, aplicaciones tipo hipertexto).

Las BDOO dan generalmente mejor funcionamiento cuando tanto los objetos como las relaciones entre ellos son complejas, lo que ocurre en el caso de los términos.

Esto se debe fundamentalmente al hecho de que los objetos no se dividen en tablas normalizadas al almacenarse ni utilizan complejos sistemas de reemsamblaje (por ejemplo mediante índices). Además la necesidad de espacio en dispositivos de almacenamiento masivo (cinta, disco óptico o disco duro) puede ser menor al no tener la necesidad de almacenar complejos ficheros de índices.

Las BDOO soportan las aplicaciones multimedia de un modo natural.

Objetos con propiedades de formas o comportamiento temporal (sonido, imagen, etc.), texto u otros conceptos, pueden ser modelados y almacenados dentro de un esquema conceptual único.

Las BDOO permiten que en una misma base de datos coexistan registros (fichas) de distinto diseño y naturaleza (formato, imagen, sonido) sin que se creen conflictos ni se pierda consistencia en la base de datos ni se desaproveche la capacidad de la memoria masiva al guardar campos "en blanco" innecesarios.

La posibilidad de extensión es un beneficio clave que surge directamente de las estructuras de clasificación de las BDOO.

Nuevos términos que se derivan de los ya introducidos pueden ser creados sin la necesidad de reestructurar parte de la base de datos ya existente, basta con definir las relaciones con otros objetos para que se transfieran propiedades de uno a otro objeto. Las funciones de agregación son más fáciles de modelar y los objetos pueden ser tratados individualmente o como colecciones.

Las BDOO suelen tener un control de navegación mejor porque los punteros a determinados objetos son almacenados en propios objetos. Es decir no hay que recurrir a un índice dado que el entorno viene indicado en el propio objeto.

Las BDOO tienen la integridad referencial inmersa en el modelo y generalmente un modelo semántico más rico que otro tipo de bases de datos.

La división y almacenamiento en dispositivos de almacenamiento masivo de los registros (fichas), es un problema para otros modelos de bases de datos.

En las BDOO las asignación de las posiciones de memoria de los objetos se realiza basada en las relaciones entre los objetos. Los objetos que forman grupos son almacenados en clusters físicamente contiguos. Es decir existe una equivalencia entre "distancia lógica" y "distancia física". Esto es un factor fundamental para acelerar el acceso a las bases de datos y rebajar el "coste" de una búsqueda en términos de recursos del sistema.

Facilidad de programación.

Los programadores de aplicaciones terminológicas solo tienen que aprender un lenguaje de programación, no dos, uno para desarrollar la aplicación y otro para desarrollar y gestionar la base de datos ya que los lenguajes de desarrollo de las BDOO son los propios LPOO.

El bloqueo del acceso a la información se hace ahora a nivel de objeto más que de tabla/índice, lo que facilita el bloqueo de jerarquías enteras de objetos de un modo eficiente.

Las BDOO encajan muy bien dentro de la arquitectura cliente/servidor y de las arquitecturas distribuidas que sin duda se están imponiendo como al soportar mejor la complejidad creciente en las comunicaciones entre bases de datos.

Si tratamos al término en todo momento como un objeto en si, sin que su naturaleza como tal se manifieste solo cuando se engarza dentro del trabajo del usuario se favorece el tratamiento de la evolución de los términos, la adaptación a nuevos requerimientos, las mejoras en su definición, etc.

Funciones como versionado, reorganización, organización y relación entre términos, son facilitadas enormemente en el caso de que los términos sean objetos y los métodos de acceso, modificación y navegación de la base de datos sean los propios de los objetos.

 

Conclusiones

Las BDOO presentan grandes expectativas para la terminología. Su principal ventaja reside en su flexibilidad de diseño y mantenimiento, junto con su capacidad de capturar la naturaleza de los elementos que almacena.

Sin embargo no podemos considerar a las BDOO como una panacea. Se trata de un instrumento nuevo con una filosofía diferente que exige un gran salto a las comunidades de gestión y mantenimiento de las bases de datos terminológicas. Además dada su reciente aparición se encuentran aún en una etapa de desarrollo aunque ya existen aplicaciones comerciales.

De todos modos consideramos como una inversión muy interesante el que la terminología se asome al mundo de las BDOO ya que los posibles beneficios rentabilizarían sin duda el esfuerzo requerido.

 

Bibliografia

De Bessé, B. Cours de terminologie. Université de Genève. 8ème ED. 1992.

Graham, I. Object oriented methods. Ed. Addison Wesley. 1994.

Gupta, R; Horowitz, E. Object oriented databases with applications to Case, Networks and VLSI Cad. Ed. Engue-Wood Cliffs. NJ Prentice Hall. 1992.

Meyer, I; Skuce, D; Bowker, L; Eck, K. Towards a new generation of terminological resources: An experiment in building a terminological knowledge base. Proc. of Coling-92, Nantes, Ag. 23-28. 1992.

Prieto Díaz, R. Implementing faceted classification for software reuse. Communications of the ACM. Mayo 1991, vol 34, nº 5.

Tanke, E.H.R. Intracompany and intercompany networking in terminology. Infoterm, 1985.

 

Editado con el apoyo de
Editado com o apoio da: