Actas / Atas
1988-2002
Presentación / Apresentação
I Simposio (1988)
II Simpósio (1990)
III Simposio (1992)
IV Simposio (1994)
    Índice
V Simposio (1996)
VI Simposio (1998)
VII Simpósio (2000)
VIII Simpósio (2002)
Índice por autores

 

 

Terminologia e operações documentárias

Nair Yumiko Kobashi
Escola de Comunicações e Artes
Universidade de São Paulo
Brasil

 

O ciclo documentário

A circulação de informações e de documentos, tal como é compreendida no âmbito da Ciência da Informação, comporta a coleta de documentos, seu tratamento e sua difusão. Como essas operações realizam-se no âmbito de instituições informacionais (bibliotecas, centros de documentação etc...), a análise rigorosa do contexto no qual se insere o sistema documentário precede as ações propriamente documentárias. É somente a partir dos parâmetros institucionais identificados, que se fixa uma política global de tratamento e de recuperação de informações, apta a responder adequadamente aos usuários prioritários do sistema.

Os dados situacionais usualmente considerados nos sistemas documentários podem ser sistematizados sob as seguintes categorias:

1. Necessidade do usuário: parte-se do princípio geral de que, é possível fornecer produtos e serviços específicos para cada usuário, segundo sua qualificação, especialidade e tipo de trabalho para o qual busca informação.

2. Domínio tratado: os especialistas de cada campo do saber recorrem a documentos variados (textos, imagens, sons, gráficos, tabelas estatísticas etc.), razão pela qual cada instituição tem um perfil próprio, que se manifesta, entre nos tipos de materiais que compõem seu acervo.

3. Recursos disponíveis: os recursos (humanos, infra-estrutura, financeiros) disponíveis na unidade de informação influem nos modos de tratar a informação. A título de exemplo: documentos a serem explorados por computador são submetidos a tratamentos que se distinguem das operações necessárias para tratar massas de documentos a serem exploradas por indivíduos.

4. Produtos e serviços: cada tipo de produto ou serviço requer operações de duração e complexidade varíaveis. A indexação de documentos, por exemplo, requer habilidades e investimento de tempo que se distinguem daquelas necessárias para a elaboração de resumos. Desse modo, cada instituição planeja produtos e serviços de acordo com os recursos de que dispõe.

5. Relação custo/desempenho: os recursos devem ser utilizados de modo a satisfazer ao maior número de demandas ao menor custo. Assim, muitas vezes, na lógica documentária, opta-se por tratamentos que, embora genéricos, possam servir a um número maior de usuários, em detrimento de operações complexas que serão úteis a um número restrito de usuários.

Tendo em vista que um sistema documentário propõe-se a responder de maneira duradoura a um conjunto específico de usuários, cada etapa do ciclo documentário é refratária à improvisação. A coleta de documentos deve ser sistemática, baseada no conhecimento dos organismos que produzem os documentos que possam interessar aos usuários do sistema. A difusão, por sua vez, deve pautar-se por um princípio básico: os produtos e serviços devem ser planejados e executados de modo a responder às especificidades da demanda. O tratamento, finalmente, submete-se aos fins da difusão, devendo, por essa razão, ser regido por parâmetros claros, sistematizados em uma política explícita e em procedimentos metodológicos claros.

 

O tratamento da informação

O tratamento da informação é, na realidade, um processo de fabricação de informações, que implica transformar um texto em informação documentária. Já a recuperação da informação, é uma ação no interior da qual se correlacionam a questão proposta pelo usuário e as informações documentárias armazenadas no sistema (resumos e índices). Portanto, entre a produção de informação documentária e a recuperação existe uma relação de pressuposição não-recíproca: esta última não é factível sem a ação anterior, a sua elaboração.

Para se falar do tratamento é necessário estabelecer uma primeira distinção entre dois aspectos inerentes ao documento: seu suporte material e seu conteúdo. O tratamento documentário do suporte material, objeto da Representação Descritiva ou Catalogação, visa elaborar a descrição normalizada de aspectos físicos do documento (nome da obra, do autor, local de publicação, ano de publicação, editora, entre outros dados). Tal modalidade de tratamento permite o acesso físico ao documento. Apesar de sua importância no fluxo documentário, ele não será discutido no presente trabalho.

O tratamento documentário do conteúdo - a Análise Documentária - visa, por outro lado, elaborar representações condensadas daquilo que é dito em um dado texto. As representações documentárias típicas são o resumo e o índice, sendo que a primeira - o resumo - responde pela função de condensação da informação e a segunda - a indexação -, pela de índice, de pista do conteúdo (Bar-Hillel, 1964a). Neste último caso, costuma-se atribuir denominações diferenciadas para a operação, de acordo com o sistema de conversão utilizado para representar o conteúdo. Assim, a classificação supõe a utilização de linguagens documentárias denominadas Sistemas de Classificação, enquanto a indexação costuma ser assimilada às operações que lançam mão de linguagens construídas tipo tesauro, ou mesmo à representação que utiliza vocabulário livre. Por serem ambas operações de mesma natureza, utilizaremos aqui o termo genérico indexação para caracterizar tanto a classificação quanto a indexação.

A elaboração de resumos e a indexação são, como se vê, operações realizadas sobre textos, os quais são analisados para se selecionar informação essencial e acessória. Em seguida, as informações consideradas essenciais são submetidas a um processo de combinação, de modo a convertê-los em novos textos, ditos resumos, ou em símbolos de uma linguagem documentária (indexação).

Em ambos os casos, os produtos são obtidos por meio de operações sucessivas de análise e de síntese, devendo eles manter relações de semelhança e de contigüidade com o objeto submetido à análise. No caso do resumo, tais relações poderão ser garantidas caso nele se mantenha a estrutura informacional e os valores referenciais do texto original (Le Roux, 1990). Uma cadeia de termos de indexação é, por outro lado, uma representação de nível inferior ao do texto; nela subsiste apenas o tópico (assunto) do texto, representado por meio da palavra, do sintagma ou por uma unidade lexical mais complexa. Neste caso, "o produto da analise é uma representação do texto formulada em uma linguagem que não se confunde com a linguagem do texto, mesmo que os termos tenham aparentemente a mesma forma" (Gardin, 1987, p. 49).

Para cumprir com eficácia as funções a que se destina, a Informação Documentária deve ser elaborada através de metodologias que garantam a equivalência de sentido entre o texto-fonte e a sua representação. Além disso, as representações documentárias devem apresentar algumas propriedades: concisão, pertinência, precisão e objetividade.

a. a concisão: o resumo e o índice devem fornecer informação suficiente, não mais do que o necessário.

b. pertinência: o resumo e o índice devem ser fiéis ao conteúdo do documento.

c. precisão e objetividade: o resumo e o índice não devem comportar ambigüidades, devendo, portanto, ser formulados através de termos precisos.

Tradicionalmente, contudo, se concebe a elaboração de resumos como meros atos técnicos de reduzir textos, ou a indexação como o ato de estabelecer equivalências entre palavras do texto e palavras de uma Linguagem Documentária. No entanto, todo ato documentário é um ato de comunicação, que tem a finalidade promover a circulação da informação. Desse modo, para ser eficaz, o ato documentário requer, inicialmente, uma visão clara dos parâmetros específicos no interior dos quais instaura-se a situação comunicativa. Os parâmetros situacionais constituem a base sobre a qual se formulam as políticas que determinam e controlam o conjunto das operações a serem praticadas. O ato documentário requer, por fim, metodologias que permitam construir os objetos que darão materialidade à Comunicação Documentária. Portanto, uma análise mais acurada dos processos documentários indicará que as suas operações centrais - ler, selecionar e representar informações - apresentam um grau de complexidade que não poderá ser explicada no interior de visões ingênuas.

 

As operações documentárias e a significação

A Análise Documentária, em sua dimensão operatória, manipula e transforma textos em dois tipos básicos de representações: o resumo e o índice. No resumo, o texto base é desestruturado de modo a permitir que certos fragmentos, organizados sob a forma de um novo texto, reconstruam potencialmente o sentido do original. Na Indexação, procura-se obter um grau ainda maior de compactação do texto base: do processo de desestruração resultam fragmentos que procuram caracterizá-lo por meio de palavras ou de sintagmas. Se o resumo mantém, de fato, uma relação de contigüidade e de semelhança com o texto que lhe dá origem, já que procura reter a estrutura informacional do original, o mesmo não pode ser afirmado em relação ao produto da indexação. Neste último caso, instaura-se uma nova ordem de sentido, mediada por um instrumento comutador - a linguagem documentária, que generaliza as informações do texto, integrando-o a "classes" já previstas no referido instrumento.

As representações documentárias mediadas por linguagens documentárias "são de caráter generalizante" porque a indexação não opera com as informações particulares do texto. Segundo Lara, "O código de intermediação funciona...como um elemento para assegurar um rendimento informativo modal. A normalização obtida através do código documentário, embora tenha, por um lado, um caráter preditivo impedindo a representação da subjetividade expressa nos textos originais, garante, por outro lado, a circulação de informações, revelando, dessa forma, seu caráter dinâmico" (Lara, 1993, p. 62). Os termos da linguagem documentária são, portanto, unidades semânticas orientadas para a monovalência, já que o seu significado é delimitado por operações de fixação semântica. As informações documentárias submetidas a essas linguagens veiculam, desse modo, conteúdos prefixados.

Já se afirmou que a palavra é reversível porque ela assume todos e nenhum significado. Ao discutir as palavras e o seu significado, Ullmann (1967) observa que "o caráter genérico de nossas palavras é uma das principais fontes de sua imprecisão. Com exceção dos nomes próprios e de um pequeno número de nomes comuns que se referem a objetos únicos, as palavras denotam, não entidades singulares, mas classes de coisas ou de acontecimentos ligados por algum elemento comum" (p.133).

A natureza genérica das palavras é um fenômeno geral da linguagem, um "elemento de abstração da linguagem" (Ullmann, 1967, p.134). Desse modo, ainda com base em Lara (1983), as unidades da linguagem documentária, embora sejam fixadas semanticamente, pelo fato de designarem "classes", e não informações particulares, elas tendem a veicular informação que apresenta certo grau de imprecisão, à semelhança das palavras da linguagem natural.

Por essa razão, no âmbito pragmático da recuperação da informação, que opera com a palavra, a indexação e o resumo atuam de forma complementar. Normalmente, a primeira etapa de busca de informação, faz-se por meio dos termos de uma linguagem de indexação. Face aos resultados da pesquisa bibliográfica, que em geral fornece um número significativo de documentos, identificados por um determinado termo, ou conjunto de termos da linguagem utilizada, é necessário recorrer aos resumos. Estes últimos determinam a pertinência dos ítens informacionais recuperados. É nesse contexto que se manifesta de forma ainda mais evidente a necessidade de se garantir a correspondência entre informações textuais e representações documentárias, sejam eles resumos ou índices.

As apropriações parafrásticas que caracterizam o resumo podem encontram na Terminologia os subsídios para operar com maior rigor. Através desta última, pode-se elaborar representações concisas e com alto grau de precisão, que evoquem, de fato, as mesmas informações contidas no texto de partida.

No caso da indexação, a Terminologia pode contribuir para a elaboração de Linguagens documentárias mais potentes. Como se sabe, a Linguagem Documentária, dada a sua função, seleciona suas unidades em diversas fontes: Linguagens de Especialidade, Linguagem de uso corrente e Terminologias de área. Por ter como ponto de partida sistemas de significação onde as relações entre signos e referentes ou entre significados e significantes são de natureza diversa, a estruturação das linguagens documentárias enfrenta problemas semânticos complexos. Na Linguagem Natural, por exemplo, o fenômeno da plurissignificação é a regra, enquanto, na Terminologia e nas Linguagens de Especialidade, embora em diferentes graus, predomina a univocidade de significação dos termos.

A primeira vista, Linguagem Documentária e Terminologia apresentam características que as tornam intercambiáveis. Contudo, a Terminologia tem como objetivo fundamental a seleção e a criação de termos para noções de domínios específicos, e sua fixação por meio da definição (Felber, 1984). As Linguagens Documentárias operam, por sua vez, em campos do conhecimento especializado para descrever e tornar recuperáveis os textos aí produzidos. Desse modo, a operação de construção de linguagens documentárias supõe, necessariamente, os instrumentos terminológicos como fontes de referência (Tálamo et al. 1992; Cintra et al. 1994).

As Terminologias não se confundem, portanto, com as Linguagens Documentárias, antes instauram-se como o universo referencial destas últimas. Nesse quadro, as Linguagens Documentárias operam como classificações intermediárias construídas na intersecção de três paradigmas designacionais, ao menos: a linguagem de especialidade (núcleo de idéias), as classificações científicas e suas definições (terminologias de áreas) e a linguagem natural.

As Linguagens Documentárias não substituem, portanto, a Linguagem Especializada, as Terminologias e a Linguagem Natural em sua função comunicativa geral, mas as primeiras - as Linguagens Documentárias - são mais apropriadas do que as demais na tarefa específica de tratar e recuperar informação. As Linguagens Documentárias compartilham com a Terminologia a característica de serem construídas para fins específicos, mas não apresentam a sua precisão; compartillham com a Linguagem Natural a função comunicativa, mas precisamente para tornar eficaz essa função, não comportam o poder expressivo desta última.

 

Bibliografia

BAR-HILLEL, J. (1964). Language and information. Reading, Mass.: Addison Wesley.

CINTRA, A.M.M. et al. (1994). Para entender as linguagens documentárias. São Paulo: APB/POLIS.

FELBER, H. (1984). Manuel de terminologie. Paris: UNESCO/INFORTERM.

GARDIN, J.C. (1973). Document analysis and linguistic theory. Journal of documentation, v. 29, n.2, p. 137-168.

GARDIN, J.C. (1987). L'analyse logiciste. In: GARDIN, J.C. et al. (1987). Systèmes experts et sciences humaines. Paris: Eyrolles, p. 17-26.

GARDIN, J.C. et al. (1964) Le Syntol: étude d'un système général de documentation automatique. Buxelles: Presses Académiques Europeénnes.

GOMES, H.E. (coord.) (1990). Manual de elaboração de tesauros. Brasília: PNBU.

GRICE, h.p. (1975). Logic and conversation. In: COLE, P; MORGAN, P. Syntax and semantics 3: speech acts. New York: Academic Press. p. 41-58.

KOBASHI, N.Y. (1994) A elaboração de informações documentárias: em busca de uma metodologia. São Paulo: ECA-USP (Tese de doutorado)

LARA, M.L.G. (1993). A representação documentária: em jogo a significação. São Paulo: ECA-USP (Dissertação de mestrado).

LE ROUX, d. (1990). Automatisation de l'activité resumante: essai de typologie. In: Colloque sur le resumé de texte. Pont à Mousson. (separata).

RONDEAU, G. (1984). Introduction à la terminologie. Québec: Gäetan Morin.

TÁLAMO, M.F.G.M. et al. (1992) A contribuição da terminologia para a elaboração de tesauros. Ciência da Informação, v. 21, n.3, p. 197-200.

ULLMAN, S. (1967). Semántica. Madrid: Aguillar.

 

Editado con el apoyo de
Editado com o apoio da: