|
Modelo para el manejo de vocabularios terminológicos
en forma de Web
Ramiro Lafuente López
Araceli Torres Vargas
Centro Universitario de Investigaciones Bibliotecológicas
Universidad Nacional Autónoma de México
México
Introducción
La terminología es un medio para conocer sistemáticamente el vocabulario científico y tecnológico, con lo cual aporta los elementos indispensables para transmitir información y conocimientos tanto entre especialistas de la misma área temática como de diferentes campos del conocimiento.
Dada esta importancia, dentro del Seminario de Epistemología del Centro Universitario de Investigaciones Bibliotecológicas (CUIB), de la Universidad Nacional Autónoma de México, se lleva a cabo un proyecto en el que se pretende analizar los términos en bibliotecología y ciencias de la información. Como producto de tal análisis, se espera dar las bases para la la creación de Diccionarios, Vocabularios, Tesauros y Estudios del lenguaje bibliotecológico.
Sin embargo, aún cuando el proyecto se realiza sobre la base del lenguaje bibliotecológico, pretende contribuir a la formulación de un método para facilitar el identificar, sistematizar y difundir la información y conocimientos relativos a los términos pertenecientes a un lenguaje especializado, cualquiera que este sea, a fin de facilitar el intercambio y difusión de información sobre los términos y sus sgnificados. Ello permitirá contribuir a evitar la proliferación de soluciones aisladas en el estudio de los lenguajes especializados.
De esta forma, el objetivo general que se persigue con el proyecto es contribuir al desarrollo de la investigación científica sobre el uso y significado de los términos en diversas áreas temáticas, a través de una propuesta metodológica que permita sistematizar los datos y facilitar la difusión e intercambio de resultados de la investigación terminológica. La finalidad es favorecer el estudio de los aspectos relativos a la investigación científica de las formas que se utilizan para constituir el lenguaje en el ámbito de una disciplina
Sus objetivos particulares son:
Ampliar la capacidad de comunicación e integración de resultados de investigación por medio de la utilización de la publicación electrónica
Cooperar en la investigación en el campo de la terminología a través del intercambio de información digital normalizada.
Establecer principios generales para identificar y analizar los los lenguajes especializados, con objeto de diseñar modelos adecuados para el proceso de datos sobre los términos y sus significados .
Estimular la creación e intercambio de documentos digitales con información sobre términos, para facilitar el estudio e investigación en el campo de la terminología de lenguajes especializados
Debido a la importancia que revisten las obras lexicográficas como instrumentos para la difusión y normalización del lenguaje especializado dedicamos, en una primera instancia, mayor atención a esta clase de obras.
Funcionamiento del sistema
El método que se propone, divide el proceso de información sobre los términos y sus significados en módulos. Cada módulo obedece a diferentes fases del registro y proceso de información producto del análisis terminológico.
En principio se prevé la inclusión de cinco módulos, mismos que se describen a continuación:
1. Definición de tipo de documento
Se considera que para lograr una adecuada configuración de una obra lexicográfica (diccionarios, vocabularios, glosarios) en forma de documento digital se requiere el diseño de estructuras lógicas y formatos para el proceso normalizado de información, así como la definición de directrices generales para la conformación de corpus de términos.
2. Identificación y definición de términos
Se diseñó un sistema para la identificación automática de términos en un texto.
El sistema realiza análisis de frecuencias, permite formar diccionarios de frases para identificar términos compuestos y facilita capturar definiciones de términos en una base de datos que se encarga de anotar el formato y convertir los datos.
3. Conversión de formatos para intercambio
El sistema permite el diseño y manejo de documentos con una arquitectura abierta para intercambiar datos por medio de un formato normalizado, con objeto de facilitar la creación de colecciones de términos.
Se sustenta en el uso de de programas de captura y conversión de datos sobre términos utilizando formatos y tablas para conversión de colecciones de términos de un formato a otro.
La conversión de formatos para intercambio comprende:
Gestión de los textos
El sistema sustenta la gestión de textos en:
Un formato que proporciona un juego de etiquetas cuyo objeto es identificar la información relativa a cada uno de los aspectos del análisis de términos; la captura de datos en los programas del sistema; la anotación del texto en formato bix por medio de un procesador de textos que genere archivos ascii y la conversión del texto entre diferentes formatos.
Título
Generación de los documentos web necesarios para conformar los acervos de un modelo de biblioteca digital, a partir de los textos anotados.
Al incluir el uso de convertidores para transferir datos se facilita el empleo de cualquier tipo de programas para procesar las colecciones de términos creadas por el sistema.
Asimismo es la base para la edición y publicación electrónica de productos términológicos.
4. Edición y publicación electrónica
La conversión de los datos como eje del proceso de información, es una de las formas más útiles para transferir información entre diversos tipos de programas para la edición de documentos digitales.
En una primera instancia el sistema está orientado a la creación automática de un sitio web, la navegación y ligas de hipertexto se realiza a partir de una tabla de temas
5. Archivos ASCII
El sistema genera archivos del tipo ASCII (American Standard Code), a partir de una colección de términos clasificados conforme a una tabla de temas.
Este formato puede manejar de manera transparente la conversión de los datos a un sistema de edición como ventura, pagemaker u otros, para producir un impreso en papel.
Características del formato para el intercambio de datos terminológicos
El formato que se propone, no está sujeto a un programa en especial, por lo que permite el intercambio de información producida por sistemas heterogéneos y garantiza la constante actualización de la base de datos.
El uso de lenguajes de marcado y formatos, junto con sistemas de conversión de datos, permite la posibilidad de homologar los datos y transferirlos entre diferentes sistemas.
De esta forma la normalización se sustenta no tanto en la uniformidad, sino en la consistencia de las estructuras para el proceso de información y en una clara definición de metas y fines.
Los datos que conforman el formato son:
Datos generales
Identificación del término
Campo temático
Fuentes de información
Notas
Etiquetas reservadas
Datos generales
| 010 Autor(es)del registro |
R [1] |
| 020 Institución(es) |
R |
| 030 País |
R |
| 040 Idioma |
R |
| 050 |
|
| 060 |
|
| 070 |
|
| 080 |
|
Definición del término
| 200 Definición del término |
R |
| 210 Contexto |
NR [2] |
| 220 Notas acerca del uso del término |
NR |
| 230 Notas sobre la obsolescencia del término |
NR |
| 240 Primera acepción |
NR |
Campo temático
| 400 Campo temático |
NR |
| 410 |
|
| 420 |
|
Fuentes de información
| 800 Asiento de la fuente para la definición |
NR |
| 810 Asiento de la fuente para la 1a acepción |
NR |
| 820 Asiento de la fuente para la 2a acepción |
NR |
| 830 Asiento de la fuente para la 3a acepción |
NR |
Notas
Desarrollo de una biblioteca digital sustentada en el web
Con base en lo planteado, se pretende conformar un acervo de documentos digitales apropiados para facilitar el desarrollo de la investigación científica sobre el uso y significado de las obras de consulta digitales en diversos tipos de comunidades.
De esta forma, una fase fundamental del proyecto está dedicada al diseño de un modelo de biblioteca digital sobre las obras de consulta. El objetivo es formar una colección de textos digitales que contribuyan a la definición de principios generales, para desarrollar una metodología común para la preparación, archivo, difusión y evaluación de estructuras lógicas para el diseño y configuración de obras de consulta.
Todo ello tiene como objeto ampliar la capacidad de comunicación e integración de resultados de investigación sobre análisis terminólogo y estructura lógica de las obras de consulta, por medio la publicación electrónica, y la cooperación en la investigación a través del intercambio de información digital previamente evaluada.
La construcción del sitio web, se realiza por medio de un programa que convierte todas las anotaciones del texto, en anotaciones de html. A partir de tablas de clasificación, genera relaciones entre los textos pertenecientes a un mismo campo temático, y produce en forma automática los documentos web necesarios para prestar servicios bibliotecarios.
El sitio web que da soporte a ésta biblioteca digital se localiza en el servidor del CUIB en la dirección: http://cuib.unam.mx/bib2001
Conclusiones
A manera de conclusiones puede decirse que:
La Terminología es un importante medio de acceso al conocimiento, por ser la disciplina encargada de estudiar sistemáticamente el vocabulario científico y tecnológico.
El preservar y difundir el conocimiento terminológico se facilita con la creación de modelos idóneos para la circulación e intercambio de resultados de investigación, por lo que hace falta establecer medios que permitan unificar los esfuerzos colectivos para elaborar colecciones homogéneas de términos analizados, dirigidas a:
Conocer la naturaleza del lenguaje que se da al interior de cada disciplina.
Facilitar la configuración de diversos productos terminológicos.
Crear modelos para organizar la producción y difusión de diccionarios y vocabularios digitales.
En este proyecto se formula una metodología común que permite la realización de análisis sistemáticos, colectivos e interdisciplinarios, que facilita el intercambio y difusión de información sobre los términos y sus significados.
El uso de una metodología común para la definición y evaluación de formatos y estructuras lógicas para producir documentos digitales con información sobre terminología, contribuirá en la formación de recursos humanos y en la creación de infraestructuras de tecnologías apropiadas para el intercambio y difusión de información sobre los términos y sus significados, evitando la proliferación de soluciones particulares o aisladas.
La utilización de la publicación electrónica, y la cooperación en la investigación en terminología por medio del intercambio de información digital normalizada, amplia la capacidad de comunicación e integración de resultados de investigación.
[1] Repetible.

[2] No repetible.

|