Actas / Atas
1988-2002
Presentación / Apresentação
I Simposio (1988)

II Simpósio (1990)

    Índice
III Simposio (1992)
IV Simposio (1994)
V Simposio (1996)
VI Simposio (1998)
VII Simpósio (2000)
VIII Simpósio (2002)
Índice por autores

 

 

La asignación de términos equivalentes en los encabezamientos de materia: un problema terminológico

María Eugenia Franceschi
Mercedes Robles
INTEVEP S.A.
Venezuela

Resumo

La indización por materia es uno de los componentes del registro de la materia bibliográfico y no bibliográfico que se realiza en un centro de información y documentación, y permite analizar el contenido de los documentos, al igual que facilita la recuperación de información. En el caso de la base de datos de la Red de Información de la industria Petrolera y Petroquímica (RIPPET), las materias se asignan utilizando, básicamente, vocabularios controlados, y se registran en forma bilingue; es decir, en inglés y en español. Luego de un estudio de una muestra tomada al azar, del campo de materia, se determinó que el mismo presenta una serie de inconsistencias en lo que respecta a la asignación del equivalente en ambos idiomas, lo cual limita el proceso de recuperación de información. En el presente trabajo se analiza este aspecto desde el punto de vista terminológico y se presentan soluciones a objeto de lograr una normalización.

 

La efectividad de un sistema de información depende en gran medida del nivel de organización y control de sus existencias, en el sentido de que éstas puedan ser identificadas y localizadas en respuesta a los requerimientos de los usuarios. Como parte de las actividades de organización y control de un centro de información y/o biblioteca, se incluyen la clasificación, la catalogación y la indización por materia de los documentos. A los fines del presente trabajo, es el proceso de indización el que reviste especial importancia y sobre el cual centraremos nuestra atención.

El proceso de indización por materia consiste en dos pasos, muy diferentes uno del otro, desde un punto de vista intelectual: el análisis conceptual del documento y la "traducción" de dicho análisis a un determinado vocabulario. Para lograr un análisis conceptual eficiente, el indizador debe, antes que nada, determinar de qué trata el documento; luego, para la "traducción" del análisis conceptual, debe recurrir a un vocabulario que defina los conceptos implícitos del documento y que permita, posteriormente, recuperar la información que contiene dicho documento.

Ese vocabulario utilizado para la indización puede estar conformado por términos que provengan directamente del texto que está siendo indizado, es decir, del lenguaje natural usado por el autor, o bien de un lenguaje controlado, el cual responde a una selección específica de términos. El primero presenta una serie de desventajas, por cuanto, desde el punto de vista de la indización del documento, no responde a parámetros precisos, debido a que cada autor se expresa en forma diferente; asimismo le otorga inconsistencia a la información, al no existir una estructura jerárquica y de control terminológico. En cuanto al usuario, este también tiene su manera particular de expresar sus requerimientos, los cuales no necesariamente se adaptan al lenguaje del indizador. El lenguaje natural, por lo tanto, resulta ambigüo, subjetivo y equívoco, y la existencia de expresiones sinónimas obliga a realizar un gran esfuerzo en la etapa de búsqueda, a fin de asegurar una correspondencia entre el lenguaje de recuperación y el lenguaje del documento.

A través de un vocabulario controlado, sin embargo, se logra un tratamiento uniforme y consistente de la información, pues el mismo está constituído por un conjunto de términos, los cuales tienen un solo significado y cada concepto es expresado a través de una sola forma gráfica. Dicho vocabulario permite que haya coherencia entre el vocabulario del indizador y el del usuario. Asimismo, controla los sinónimos, evita la utilización de términos diferentes para expresar los mismos temas, indica el término preferencial y destruye los homógrafos asignándoles notas que indiquen sus posibles acepciones. El control del vocabulario de indización promueve la representación consistente de materias tanto por parte de los indizadores como de las personas que realizan las búsquedas de información, de manera de evitar la dispersión de documentos relacionados. Los indizadores manejan, así, un lenguaje común, el cual les permite comunicarse entre si en caso de que surja alguna duda, ya que los términos son seleccionados de listas pre-establecidas, y no de una manera arbitraria. En lo que a recuperación se refíere, facilita las búsquedas sobre el tema por medio de la fusión de términos cuyos significados están relacionados paradigmática o sintagmáticamente. Este tipo de vocabulario controlado puede estar representado por una lista de encabezamientos de matéria, un esquema de clasificación, un tesauro o simplemente una lista de palabras claves.

En el caso de la Red de Información Petrolera y Petroquímica (RJPPET), la cual integra diferentes centros de información y documentación de Petróleos de Venezuela y sus filiales, y del Ministerio de Energía y Minas, la indización se realiza, basicamente, a través de los encabezamientos de materia de la Biblioteca del Congreso de los Estados Unidos; además, se consultan los tesauros en inglés de American Petroleum Institute (API), en el área de refínación y petroquímica, y el de la Universidad de Tulsa en el área de exploración y producción. De ser necesario, se llevan a cabo consultas conceptuales y/o terminológicas con los autores de los trabajos, en caso de informes, o con los investigadores del área correspondiente al documento que está siendo indizado. Finalmente, una vez determinada la materia, ésta se registra en forma bilingüe, en inglés y en español.

Ahora bien, por diferentes razones, estos recursos presentan actualmente una serie de dificultades. Los encabezamientos de materia de la Biblioteca del Congreso norteamericana, aunque confiables, son poco específicos para centros de información especializados como los que integran la Red, por cuanto abarcan áreas generales del conocimiento, y estos centros exigen un cierto nível de especifícidad en el tema petrolero y campos afines. En cuanto a los tesauros, estos son herramientas de control terminológico utilizadas para traducir a un lenguaje documentario el lenguaje natural usado en documentos pertenecientes a un área específica. Desde un punto de vista de su estructura, los términos allí incluídos guardan relación entre sí; estas relaciones pueden ser de equivalencia (referencias cruzadas), asociativas (relación no jerárquica de un término con otro) y jerárquicas (superioridad o subordinación), relación esta última característica unicamente de los tesauros. No obstante, estas herramientas solo están disponibles en inglés, lo cual dificulta la asignación de materias en español. Con respecto a las consultas con autores e investigadores, estos utilizan el lenguaje natural, el cual, como ya hemos mencionado, presenta una serie de desventajas.

A manera de ilustrar lo arriba expuesto, nos hemos permitido realizar una serie de búsquedas comparativas sobre temas específicos del área petrolera, utilizando, por un lado, los tesauros mencionados, y por el otro, los encabezamientos de materia de la Biblioteca del Congreso de los Estados Unidos. La especifícidad y precisión que poseen los términos indizados tanto en el tesauro API como en el de Tulsa, es notoria con respecto a los encabezamientos de matéria.

Por ejemplo, el término "polymer" aparece indizado en el tesauro de API [1], mientras que en la lista de encabezamientos, el mismo término se encuentra indizado junto con "polymerization" [2], factor que le resta especificidad a la búsqueda. Al investigar el término "particulates" en los encabezamientos de materia, este presenta una relación de equivalencia que remite a términos mucho más generales [3]; lo mismo ocurre con el término "reforming", el cual remite unicamente a "catalytic reforming" [4], a pesar de que conocemos, por la literatura, que no todas las "reformaciones" son catalíticas, sino también "térmicas" y "con vapor" [5]. Cuando se hace una búsqueda en el tesauro de API sobre el tema "sweetening" [6], de uso común en el área petrolera, se encuentra un nível de precisión que los encabezamientos de materia no poseen. La diferencia entre las relaciones semánticas del término "well" indizado por la Universidad de Tulsa, es apreciable con respecto al de los encabezamientos de materia. En estos últimos se observa que los términos que conforman las relaciones son de naturaleza general; sin embargo, en el tesauro de Tulsa hay más precisión, más profundización y, logicamente, todos los términos están relacionados con pozos petrolíferos. Por otro lado, ciertos temas, propios también del petróleo, no se encontraron en los encabezamientos, como por ejemplo "plugging", "coeffícient of friction", "lutite" y "pour point".

Como podemos observar del análisis de estos términos, los tesauros son los instrumentos que mejor se adaptan a centros de información y documentación especializados. Y este es el caso de la Red, de manera que los tesauros de API y de Tulsa constituyen las herramientas más adecuadas. No obstante, el hecho de que solo estén disponibles en inglés, entorpece la asignación de materias en español y, como ya hemos mencionado, se hace entonces necesario recurrir al lenguaje natural, razón por la cual se realizan consultas con los autores de los trabajos o con investigadores.

A objeto de ejemplificar los problemas terminológicos que se presentan en la base de datos Rippet, al asignar las materias, presentamos un análisis de algunos registros, tomados al azar. (Gráfico 1).

En este registro, el equivalente asignado al encabezamiento de materia en inglés "reservoir sand" es "reservas de arena". Al buscar este término en los encabezamientos de materia de la Biblioteca del Congreso y en el tesauro de Tulsa, observamos, en primer lugar, que el mismo no aparece registrado en ninguno de estos documentos. Por otra parte, no existe equivalencia entre el inglés y el español, por cuanto "reservoir sand" no corresponde a "reservas de arena", sino más bien a "yacimientos de arena". En último lugar, el término "reservoir properties" tampoco aparece registrado en los dos instrumentos utilizados para la búsqueda, así como tampoco su equivalente en español. (Gráficos 2 e 3).

En este caso, el término "sandstone" presenta como equivalente en español, en un registro, "arenisca" y en otro, "areniscas". A este respecto podemos señalar que existe una inconsistencia en el uso de la marca de singular y plural, pues para un encabezamiento de materia en inglés se genera dos en español. (Gráficos 4 e 5).

En el caso de "chemisorption", observamos que presenta dos equivalentes en español, "quimioadsorción" y "quimoadsorción", los cuales no se adaptan al mismo proceso de formación terminológica que ha tenido su equivalente inglés.

Este término designa el proceso de adsorción química. Al analizar como surge en inglés, determinamos que el mismo es el resultado de la unión de "chemistry" y "adsorption", en donde se ha conservado la parte inicial del primer elemento, es decir, "chemi-" y la parte final del último, "-sorption". Si efectuamos el mismo procedimiento en español, entonces, a partir de los vocablos "química" y "adsorción" mantendremos, del primer elemento, "quimi-" (y no "quimio-" o "quimo-" como aparece en la base de datos), y luego "-sorción", para crear el término "quimisorción", el cual se adapta a la estructura de la lengua castellana [6]. En terminología, esta es una forma usual de creación de términos [7]. (Gráfico 6)

En este registro observamos que no existe equivalencia entre el término inglés "desulfurization" y el español "desulfuración", pues cada término responde a una realidad diferente. A objeto de determinar las razones por las cuales no hay equivalencia, es necesario analizar los términos en inglés "sulfiding" y "sulfurization". El primero significa: 'Tratamiento químico de un compuesto orgánico o inorgánico para generar un sulfuro" [9], y tiene por equivalente en español "sulfuración"; y el segundo se define como: "Acción de combinar un elemento o un compuesto para crear un producto que contenga azufre", el cual equivale en español a "sulfurización" [10].

Si tomamos como base lo anterior expuesto, los encabezamientos de materia en español "desulfuración" y "desulfurización" que aparecen en el registro, serían igualmente nociones diferentes, de modo que no deberían ser usados indistintamente, aparte de que, como lo hemos señalado, un término técnico debe estar representado por un solo concepto. (Gráficos 7 e 8).

En el caso del término "trace elements", observamos que en español se ha colocado más de un equivalente; es decir, más de un encabezamiento de materia en español, para uno solo en inglés. Este es un caso típico de sinonimia, y desde el punto de vista terminológico, un término técnico debe expresar solamente un concepto, y cada concepto debe estar expresado por un solo término [11].

Si analizamos cada uno de estos sinónimos, podemos señalar, en el caso de "trazas de elementos", que primeramente se trata de una traducción que no corresponde con el equivalente en inglés, por cuanto se ha traducido literalmente cada palabra y en el mismo orden que en inglés, sin tomar en cuenta que la palabra "trace" funciona como adjetivo y "elements" como substantivo, por lo que gramaticalmente, en español debería ser "elementos traza". Ahora bien, esto no significa que dicho término sea el equivalente exacto en español, por cuanto la búsqueda de este equivalente debe responder a una metodología bien definida, consistente, antes que nada, en la verifícación de la equivalencia de nociones en los dos idiomas, para luego determinar su forma gráfica [12].

En cuanto al término "elementos de rastro", suponemos que se trata de una traducción aparecida en algún diccionario bilingüe, lo cual no garantiza su uso como término controlado. (Gráficos 9, 10 y 11).

Para el término en inglés "waste disposal", encontramos, como en el caso anterior, tres encabezamientos de materia diferentes en español: "desperdicios. Eliminación de", "desechos. Eliminación de" y "desperdicios riesgosos". En cuanto a los dos primeros, podemos decir que se trata de términos sinónimos. A este respecto, ya nos hemos referido anteriormente.

En cuanto al tercero, "desperdicios riesgosos", se trata de otra realidad, pués no equivale al vocablo en inglés "waste disposal", especialmente si consideramos que en este mismo registro aparece en inglés otro encabezamiento de materia, "hazardous waste", el cual sí correspondería con el español "desperdicios riesgosos". (Gráfico 12 y 13).

Aquí observamos que el encabezamiento de materia "industrial waste" no tiene su correspondiente en español, o tiene por equivalente dos términos, "desperdicios riesgosos" y "desperdicios sólidos", a pesar de que al realizar una búsqueda por materia con el término "desechos", si aparece el vocablo "desechos industriales" como encabezamiento de materia. Esta situación la observamos en cierta cantidad de registros. (Gráfico 14)

Para este registro podemos señalar que, de acuerdo con los encabezamientos de materia de la Biblioteca del Congreso norteamericana, "geotectonics" nos remite a "Geology, Structural" [13]; lo que significa que éste debe ser el término indizado. Ahora bien, si este es el caso en inglés, en español debería ocurrir lo mismo, y en lugar de "geotectónica" se utilizaría como encabezamiento de materia, el término correspondiente al inglés; es decir, "geología, estructural".

El análisis de esta muestra nos lleva a confirmar la inminencia de contar con una herramienta de indización en español para la base de datos RIPPET. Conscientes de esta realidad, el Centro de Información Técnica (QT), de Intevep, S.A emprendió un proyecto de gran envergadura, que comprende la elaboración de un tesauro propio de la industria petrolera, y al cual nos referimos en el Primer Simposio, celebrado en Venezuela [14].

Como indicáramos en aquella oportunidad, éste es un proyecto que implica años de labor. Por tal motivo, se decidió dar a conocer el producto de cada año de trabajo, a través de la publicación de glosarios, los cuales abarcan un tema específico dentro de un campo en particular. Hasta los momentos, contamos con dos glosarios enmarcados en el área de procesos de refinación y petroquímica, los cuales suman 650 términos. El primero está conformado por términos relativos a procesos industriales patentados, y el segundo por la terminología de base de dichos procesos. Ambos contienen el término en español con su equivalente en inglés y la defínición en español.

Estas publicaciones pretenden servir de guía tanto a los indizadores de los distintos centros de información y documentación de la Red, en el proceso de asignación de materias en forma bilingüe, como a los usuarios de dichos Centros, para la recuperación de información. Asimismo, tienen por objetivo ser una herramienta para los investigadores, en lo que concierne a la terminología que se ha de utilizar en la elaboración de trabajos o informes técnicos y otros, a la vez que constituyen un aporte al desarrollo y consolidación de una terminología propia, adaptada a las exigencias de la industria nacional.

Gráficos:

 

[1] AMERICAN PETROLEUM INSTITUTE (API). Thesaurus. Washington, D.C. American Petroleum Institute, 365 pp. p. 198. 1987.

[2] LIBRARY OF CONGRESS. Subject Heading. 11th Edition. Washington, D.C.: Subject Cataloging Division. Processing Services, 4.164 pp. p. 2.945. 1988.

[3] (ibid.,2.774).

[4] (ibid.,3.155).

[5] Mc Graw-Hill Dictionary of Scientific and Technical Terms. Lapedes, D.N. editor. New York; Mc Graw-Hill, 1830 pp. 1978.

[6] AMERICAN PETROLEUM INSTITUTE (API). Thesaurus. Washington, D.C. American Petroleum Institute, 365 pp. p. 242. 1987.

[7] FRANCESCHI, M.E. Vers la création de termes en espagnol dans une langue d'espécialité. Mémoire de D.E.A., Université de Paris XIII, p. 14, 1989.

[8] AUGER, P. & ROUSSEAU, L. Méthodologie de la recherche terminologique. Études, recherches et documentation. Québec; Office de Ia Langue Française, 80 pp. p. 55. 1978.

[9] FRANCESCHI, M.E. & ROBLES, M. Glosario de procesos de refinación y petroquímica (II). Los Teques; Ediciones Técnicas, INTEVEP, S.A. 72 pp. p. 51. 1990.

[10] (ibid., p.51)

[11] BRITISH STANDARD INSTITUTION. The Selection, Formation and Definition of Technical Terms. Norma n° B.S. 3.669: 1963. 1963.

[12] DUBUC, R. Manuel pratique de terminologie. 2ème édition, revue et augmentée. Montreal; Linguatech, 158 pp. 1985.

[13] LIBRARY OF CONGRESS. Subject Heading. 11th Edition. Washington, D.C.: Subject Cataloging Division. Processing Services, 4.164 pp. p. 1.509. 1988.

[14] FRANCESCHI, M. E. & ROBLES, M. "Hacia la elaboración de un tesauro de la industria petrolera nacional" En Primer Simpósio Latinoamericano de Terminología. Universidad Simón Bolívar, Sartenejas, Venezuela. Abril 1988.

 

Editado con el apoyo de
Editado com o apoio da: