|
Instrumentos de controle terminológico: limites e funções
Maria de Fátima Moreira Tálamo *
Marilda Lopes Ginez de Lara *
Nair Yumiko Kobashi *
Vânia Mara A. Lima * *
* Universidade de São Paulo, ECA
** Universidade de São Paulo, FFLCH
Brasil
Resumo
Os instrumentos de controle terminológico apresentam-se como ferramentas importantes, senão imprescindíveis, para indexar e recuperar informações. É necessário reconhecer, no entanto, que há limites para sua utilização. Referenciais lexicológicos e semióticos permitem identificar não só esses limites como também as potencialidades dos referidos instrumentos. O conhecimento sistemático, e não apenas empírico, dos procedimentos de controle terminológico poderá conduzir à construção de instrumentos com possibilidades ampliadas de representação e de recuperação. O conceito de "enciclopédia", de Umberto Eco, abre perspectivas interessantes para a construção de instrumentos terminológicos de novo tipo.
"Só em pequenas representações parciais (espacialidade, animais, cores...) tudo parece hierarquizado, mas a maneira pela qual tomamos pertinente o mundo que conhecemos está em evolução contínua". (Eco, 1984, p. 42-43).
1. Introdução.
Os instrumentos de controle terminológico definem-se como linguagens com um número limitado e controlado de termos que atuam em dois níveis: a) na análise, síntese e representação de discursos; b) na representação de buscas de informação.
Dessa forma, pode-se considerar que o cerne da relação entre documentos e instrumentos de controle terminológico está na representação. Discutiremos aqui as funções e limites dos referidos instrumentos, enfocando de maneira particular os tesauros.
2. Referenciais para a construção de tesauros.
A construção dos tesauros apóia-se, basicamente, em dois grandes conjuntos referenciais: de um lado, na estruturação mais ou menos consensual do universo de conhecimentos, em grandes blocos de assuntos; de outro lado, em um corpus determinado de produção discursiva, do qual são retirados os termos considerados significativos. Supõe-se que a adoção desses parâmetros possa assegurar a eficácia dos tesauros, enquanto instrumentos de controle terminológico, para representar e recuperar informação.
O primeiro conjunto, acima referido, pretende garantir, de forma classificatória e preditiva, a organização do universo objeto de representação; o segundo, a "garantia literária", pretende respaldar o critério de representatividade da seleção dos termos de um dado conjunto de discursos, para a representação dos conceitos mais recorrentes.
Envolve, portanto, um procedimento de denominação, que não se resume no mero reconhecimento de palavras, mas visa antes de tudo a determinar o arranjo das significações dos termos selecionados. Neste sentido, o controle terminológico se faz através do reconhecimento das propriedades dos termos, mesmo que tal reconhecimento se faça, na maioria das vezes de forma intuitiva.
Desse modo, o processo de denominação exerce uma função cognitiva importante: transformar informações de naturezas diversas em forma verbal, suscetível, ela mesma, de disseminar conceitos. Por extensão, exerce também una função social. Para a análise documentária interessa, na verdade, o poder da lexicalização de construir e constituir o universo do discurso. A função de denominação documentária permite, portanto, que os agentes imponham à comunidade o reconhecimento de certos fatos.
2a. A estrutura básica dos tesauros
A macro organização dos tesauros pressupõe uma divisão hierárquica do conhecimento, característica dos sistemas tradicionais de classificação bibliográfica. Essa organização — que figura como pano de fundo do tesauro— tem sua base na lógica aristotélica e no conceito de indução de Bacon. As subdivisões das classes obedecem a uma diferenciação que postula a inclusão ou não-inclusão de uma dada qualidade, a exemplo da árvore de Porfírio, onde o princípio de divisão dicotômica faz derivar apenas duas classes: A e não-A. Essa organização pressupõe, basicamente, as relações de gênero/espécie, todo/parte e diferença e conseqüentemente, relações de implicitação, ou seja, "os nós baixos da classificação implicitam necessariamente os nós altos" (Eco, 1984, p. 46). Exemplificando: "... se uma sustância for racional será necessariamente animada, se for animada será necessariamente corpórea, e se corpórea será substância" (Eco, 1984, p. 49). Em forma de árvore veríamos as seguintes articulações:

(Eco, 1984,p.46)
A árvore de Porfírio, entretanto, é uma construção relativa que depende, sobretudo, da escolha da qualidade que subsumará as subdivisões sucessivas... "posso pôr o homem na árvore de Porfírio na qual se considere sua natureza orgânica ou inorgânica, e não a natureza mortal. O homem é necessariamente mortal somente numa árvore de Porfírio particularmente focalizada no problema da duração da vida." (Eco, 1984, p. 51). Portanto, a árvore de Porfírio é selecionada "sob pressão" contextual, podendo ser considerada verdadeira apenas em relação a um determinado código e não em relação às propriedades dos objetos em si mesmos. Ela é uma árvore que estrutura a substância semântica, representando-a como traços hierarquizados. Tal hierarquia não incorpora o contexto, ou mais precisamente incorpora apenas um contexto, considerado como um suporte prévio para a interpretação discursiva.
No entanto, nada nos autoriza a proceder a uma associação direta entre o tesauro e a árvore de Porfírio. Enquanto esta supõe uma definição clara das qualidades envolvidas em cada hierarquia (como ocorre com a CDD e a CDU), o tesauro, muitas vezes, relega a classificação proposta de início, preditiva portanto, a um segundo plano, a favor de um enfoque centrado na própria relação existente entre os descritores, aproximando-se desse modo, dos procedimentos utilizados nas teorias de classificação mais modernas. Dito de outro modo, os procedimentos de elaboração e uso do tesauro baseiam-se tanto na hierarquização do conhecimento (as árvores de Porfírio), quanto nos pressupostos das teorias de classificação mais modernas (Ranganatham, E. De Grolier, J. Kaiser, B.C. Vickery) que estendem as possibilidades de análise dos assuntos, ao postular a análise facetada, com a inclusão dos predicativos aristotélicos (particularmente a categoria do acidente, que permite associações de descritores de diferentes naturezas).
Nesse sentido, a dificuldade do tesauro de processar um efetivo controle terminológico fica por conta da ausência de uma definição clara do seu fundamento. Usualmente considerado de natureza dicionarial (sob o ponto de vista lingüístico), o seu uso fica comprometido pelo aparecimento de qualidades do discurso individual, que não são passíveis de serem enquadradas em parâmetros prévios e preditivos. Assim, em lugar de uma análise da significação discursiva com referência às circunstâncias de emissão, supõe-se uma interpretação do discurso amarrada em definições conceituais (das propriedades da palavra) quase sempre obscuras ou intuídas, já que muitas vezes as relações semânticas entre os descritores não são suficientemente precisas. Perde-se desse modo a informação, em prol de uma atribuição de sentido, prevista e sedimentada fora das circunstâncias de enunciação.
3. O tesauro como objeto cultural.
A árvore hierárquica fundamental do tesauro funciona de forma dicionarial, ou seja, pressupõe uma definição do tipo "se - então", calcada num código institucional: seus limites dependem dos contratos de natureza social, supondo modelos sócio-culturais e ideológicos determinados. O extrato abaixo pretende ilustrar esta afirmação:
DEVELOPMENT BANKS |
BANQUES DE DEVELOPPEMENT / BANCOS DE
DESARROLLO -11.02.02 |
TT: |
AID INSTITUTIONS |
|
FINANCIAL INSTITUTIONS |
BT: |
AID INSTITUTIONS |
|
BANKS |
MT: |
AFRICAN DEVELOPMENT BANK |
|
ASIAN DEVELOPMENT BANK |
|
CABEI |
|
CARIBANK |
|
IDB |
|
WORLD BANK |
RT: |
AGRICULTURAL BANKS |
|
AID FTNANCING |
|
INDUSTRIAL BANKS |
(Macrothesaurus, 1985, p.44)
A inclusão do Banco Mundial entre os Bancos de Desenvolvimento, pressupõe a aceitação de uma definição de desenvolvimento que permita identificar as ações desenvolvidas por esse órgão, com aquelas que se encontram nos limites do conceito de desenvolvimento, tal como é caracterizado pela instituição em questão (OCDE e as Nações Unidas). Uma conceituação diferente de desenvolvimento (uma definição diferente) implicaria rejeitar a inclusão do Banco Mundial no rol dos bancos voltados para o desenvolvimento.
Nesse sentido, o tesauro funciona, pelo menos implicitamente, como um objeto cultural que registra e dá forma ao conhecimento segundo parâmetros relativamente limitados. Tais parâmetros, que se materializam sob a forma de redes de relações entre descritores, determinam não só a análise dos discursos mas também o modo de organização e disseminação da informação.
Além disso, e por essas razões, a representação em forma de dicionário implica, também, na discussão sobre o verdadeiro ou falso. A veracidade de uma asserção (e a verdade da definição implícita nos termos de representação escolhidos como "autorizados" aos tesauros) é relativa, só estando assegurada em relação a um código que pressuponha sua aceitação. Em outras palavras, a condição de verdade só é válida para determinadas situações e dependendo de circunstâncias específicas. Essas condições serão, por sua vez, determinadas a partir do recorte feito no campo conceitual. No caso dos tesauros, esse recorte é delimitado, inicialmente, pela escolha de um princípio de organização do conhecimento; à organização derivada dessa escolha, são acoplados os termos e conceitos resultantes de um novo recorte feito na literatura da área — que funciona como fonte de alimentação para a seleção de termos e conceitos mais recorrentes.
Ao realizar esses sucessivos recortes para a construção dos tesauros, opera-se uma escolha que fica subjacente como marca institucional. Essa marca fica implícita, por exemplo, para o caso dos Bancos de Desenvolvimento que mencionamos acima, onde uma determinada concepção define e garante a inclusão dos órgãos que dele farão parte.
Esses recortes são consubstanciados, por sua vez, no momento da construção dos tesauros, através de signos lingüísticos (que passam a constituir os signos documentários), como resultado de uma conduta onomasiológica. Esse procedimento, segundo Hjelmslev, "parte da consideração da substância do conteúdo (conceito) para chegar à forma de conteúdo (signos lingüísticos que correspondam ao recorte do campo conceituai" (Dubois, J. et al. 1978, p. 441).
A identificação do termo com o conceito, entretanto, tem seu valor teórico fundado "na ilusão ingênua de uma equivalência absoluta —para não dizer identidade— entre signo lexical e conceito" (Rey, 1977, p. 16), pressupondo também uma estabilidade e coerência do conceito que só se verifica a nível terminológico.
Desse modo, a rede de relações prescritas pelos tesauros, supõe que ela irá manifestar-se nos discursos que estão por vir. Como, via de regra, tal materialização só ocorrerá nos discursos assentados em recortes semelhantes, a análise dos discursos que participam de outros paradigmas (por exemplo, contraditórios) introduzem um processo de semiose, cujos interpretantes não previstos de início passam a ser articulados quase que livremente, convivendo com hierarquias estabelecidas.
4. A ausência de definições nos tesauros.
Como instrumento de controle terminológico de natureza dicionarial, espera-se do tesauro uma definição precisa das propriedades dos descritores. No entanto, não é isso o que ocorre na prática.
Os tesauros estruturam seus termos de forma relacional, compreendendo três espécies principais de relações semânticas: hierarquia, equivalência e correlação. A partir de uma classificação geral - identificada na estrutura hierárquica e nas listas de grupos de descritores - que varia segundo a especificidade da área objeto (e de um tesauro para outro), os termos são dispostos segundo a amplitude relativa dos conceitos correspondentes aos descritores: Top Term - TT, Termo Genérico - TG e Termo Específico - TE, correspondendo à aplicação das divisões gênero/espécie, todo/parte, principalmente. As relações de equivalência operam ao nível da sinonímia lingüística e documentária, representadas pelos operadores de função Use e Usado para - UP; as correlações agrupam, sem explicitar o tipo de operação em jogo, as associações entre os termos, sendo representado pelo operador de função Termo Relacionado - TR, ou Termo Associado - TA.
A organização dos termos escolhidos para a representação dos conceitos de área é feita de forma a permitir a inferência de seu significado (sua extensão e intensão), através da posição do termo/conceito na estrutura do instrumento. Ou seja, a definição só será dada pelo grau e tipo da circunvizinhança de um termo. As entradas dos tesauros são, então, instrumento, supondo-se, para isso, que os traços que contribuíram para sua definição já tenham sido dados.
No entanto, o campo semântico é explicitado, na maior parte das vezes, apenas pela proximidade dos termos. Para isso contribuem também os operadores de função (e ocasionalmente a notação do tipo classificatório). Somente em alguns casos, aparecem notas explicativas relativas ao âmbito de aplicação dos descritores (notas de escopo).
Portanto, a estrutura, aparentemente aberta do tesauro, é de natureza subjetiva (determinada pelo recorte), embutindo um determinado conjunto de definições que, se explicitadas, garantiriam melhor sua função de instrumento de controle.
Por outro lado, essa ausência de definições no tesauro (glossário), vai conferir, quando de sua aplicação, um aspecto homogêneo à massa documental por ele representada, perdendo-se conseqüentemente, a "novidade" particular de cada documento. Desse modo, a representação de um discurso novo acaba pondo em cheque o sistema organizado (ou quase organizado), de relações semânticas.
5. Considerações finais: o semântico e o semiótico: o dicionário e a enciclopédia.
O tesauro como instrumento de controle terminologia) caracteriza-se simultaneamente como vocabulário [1], pretendendo assim ser uma nomenclatura [2]. Isso se deve ao fato de, como vimos, ele buscar valores unívocos para as várias ocorrências. Como instrumento operacional, o tesauro constitui-se por meio de justaposição, combinação e sobreposição de diversas áreas. Exemplificando: Tesauro de Energia, Tesauro de Desenvolvimento, Tesauro de Transporte, etc... Por sua vez, o corpus, onde se opera a seleção de termos, é constituído por sistemas e códigos fortes e fracos. Ou seja, o sistema forte impõe-se como núcleo do instrumento, ao qual subordinam-se ou acoplam-se áreas periféricas.
Após a seleção, segundo o critério acima assinalado, os termos são organizados semanticamente. É justamente essa passagem que confere, a nosso ver, a dificuldade no uso do tesauro para a análise documentária.
De um modo geral, a organização semântica dos descritores pressupõe a existência de uma ligação conhecida entre o significado e o significante. O fundamento de tal relação pode estar assentado em relações objetivas ou em um fato psicológico. Nesse último caso, diz-se que os signos são imotivados e relacionam-se através de associações. Esta é a interpretação usual de signo feita a partir da obra de Saussure.
Para Peirce, ao contrário, tudo pode ser um signo, desde que seja interpretado como tal. Para que algo seja um signo exige-se a presença de um fundamento (Peirce, 1977). A sua classificação dos signos, segundo o fundamento que os definem como tal permite distinguir entre conexão física (o hábito) e fundamento lógico da relação de significação.
A classificação geral dos signos em índice, ícone e símbolo propicia, desse modo, a análise das relações entre o signo e a realidade exterior determinando, em larga medida, como o processo de significação deve ser abordado.
Cones e índices são signos motivados. São signos cuja relação de significação não tem uma dimensão cognitiva. Assim, o ícone (o retrato em relação ao objeto modelo) e o índice (a fumaça em relação ao fogo), são, para Peirce signos naturais.
Dascal contesta tal caracterização dos signos motivados. Para ele, a realidade cognitiva é a única responsável pelo fato de algo se transformar em signo (Dascal, 1978).
O reconhecimento da presença da realidade cognitiva para que qualquer coisa possa funcionar como signo permite, por sua vez, uma caracterização da classificação mais profícua dos signos segundo seu fundamento. Assim, o ícone será um signo dada a presença de uma similaridade de fato entre ele e o seu objeto. O índice será signo dada uma contigüidade de fato. E, finalmente, o símbolo (o signo que nos interessa) não tem como fundamento apenas uma conexão psicológica (subjetiva) ou hábito. Seu fundamento é uma contigüidade instituída.
Nesse sentido, para que a interpretação de signos seja um meio de aquisição de conhecimentos, é preciso conhecer as propriedades gerais do signo. A motivação — quer seja natural ou instituída— é portanto essencial. Conhecê-la é instrumento necessário para que as características cognitivas da relação de significação se manifestem.
O signo, além disso, não é uma entidade formada pela associação de um significado e um significante. A sua existência é garantida pelo processo de semiose, no qual o signo é interpretado por outros signos, denominados interpretantes. Assim, as propriedades do signo não são dadas a priori . Quando isso ocorre, diz-se que a significação da palavra é dada pela relação lógica de entailment, implicação estrita "se p então necessariamente q". Essa é a forma geral da definição dicionarial (Eco, p. 45).
O dicionário, portanto, institui a contigüidade entre o signo e o objeto, segundo propriedades que têm a força de postulados de significado. Como isso, na prática, quase nunca ocorre (o tesauro, por exemplo, é de natureza dicionarial, mas não apresenta o rigor necessário para sê-lo), o puro hábito passa a operar como fundamento das associações que regulam e dão forma à significação. De natureza subjetiva, o hábito, muitas vezes denominado bom-senso, não dispõe dos meios necessários — lógico-semânticos e semióticos— para representar com fidelidade as significações.
Pode-se perceber com facilidade, portanto, que a contigüidade instituída aprioristicamente (tal como faz o dicionário), é um instrumento limitado para a elaboração de representações. Na verdade, cada texto institui a significação: "Nós tornamos pertinentes e construímos modelos reduzidos de formas do conteúdo sempre ad hoc , isto é, por ocasião de um dado texto, de uma dada série de expressões a serem interpretadas" (Eco, p. 43).
Nessa perspectiva, as análises de textos com fins documentários fundadas unicamente em representações apriorísticas ou no bom senso podem até funcionar na prática. Mas não são instrumentos de conhecimento, pois disseminam apenas aquilo que já está previsto, na medida que não constroem a representação do conteúdo ad hoc , o seu produto não postula significados, antes os impõe e até os deforma.
Nessa perspectiva, a análise, a síntese e a representação de texto só pode ser feita no interior de campos de organização de conteúdo, muitas vezes contrastantes, o que possibilita o aparecimento do processo de semiose, da cadeia de interpretantes peirceana, fonte da construção de significações.
A representação do texto ad hoc introduz, portanto, na análise documentária a variável "momento da emissão do texto" porque é apenas nele e através dele que muitas propriedades são instituídas ou resgatadas. O sistema que alicerça tal representação não é mais de natureza dicionarial (prescritiva) mas de natureza enciclopédica.
Isto quer dizer que abandona-se um sistema que privilegia a representação semântica dos termos a favor de estratégias que permitem amalgamar propriedades (sejam das necessárias ou acidentais), de modo a estabelecer as isotopias do texto. Essa é a representação enciclopédica. Nosso próximo desafio é tentar estabelecer os princípios de sua construção.

[1] Lista exaustiva de ocorrências que figuram num corpus especializado. (Dubois, J. et al., 1978).
 [2] A nomenclatura supõe biunivocidade da relação significante-significado (Dubois et al., 1978).

Referências bibliográficas
DASCAL, M. (1978). La sémiologie de Leibniz. Paris. Ed. Aubier Montaigne.
DUBOIS, J. et al. (1978). Dicionário de Lingüística. São Paulo, Cultrix.
ECO, U. (1984). Conceito de texto. São Paulo, TA. Queiroz/EDUSP.
MACROTHESAURUS for Information Processing in the Field of Economic and Social Development. (1985). New York, United Nations.
PEIRCE, S.C. (1977). Semiótica. São Paulo, Perspectiva.
REY, A. (1977). Le lexique, images et modèles: du dictionnaire à la lexicologie. Paris, Armand Colin.
|