|
Linguagem documentária em odontologia: uma aplicação do sistema de indexação "PRECIS"
Mariângela Spotti Lopes Fujita
Universidade Estadual Paulista "Júlio de Mesquita Filho"
Brasil
Resumo
Construção de um tesauro de Odontologia, inédito para a área, mediante aplicação do sistema PRECIS para compilação e seleção dos termos de indexação. O projeto piloto deverá considerar como "corpus" básico e inicial para a indexação e extração do vocabulário da área, a produção científica da Faculdade de Odontologia de Bauru da Universidade de São Paulo, publicada de 1967 a 1989 no periódico "Estomatologia e Cultura" (atualmente "Revista de Odontologia da USP"). A fim de viabilizar a aplicação automática do PRECIS foi realizado projeto de pesquisa, financiado pelo CNPq, pra elaboração de programa de computador compatível com a metodologia do sistema.
1. Apresentação
Linguagem documentária ou linguagem de indexação é definida, segundo Van Slype [60], como um sistema de representação do conteúdo dos documentos e das perguntas, tendo como finalidade a recuperação dos documentos. Para isso é dotada de estrutura própria, controlada, padronizada e hierarquizada.
O exemplo mais característico de linguagem documentária é o tesauro, "uma lista autorizada ou vocabulário controlado, da terminologia de uma determinada área de assunto, é uma enumeração de termos de indexação aprovados da qual o indexador e o pesquisador farão suas seleções. [13]
Em uma definição mais completa, UNISIST considera tesauro de acordo com sua estrutura e função: [37]
SEGUNDO SUA FUNÇÃO: "Um tesauro é um meio de controle terminológico, usado para transladar a linguagem natural de um documento a uma linguagem sistemática (linguagem de informação), e vice-versa.
SEGUNDO SUA ESTRUTURA: "Um tesauro é um vocabulário controlado e dinâmico de termos relacionados semântica e hierarquicamente, que cobre amplamente um domínio específico do conhecimento."
A idéia da construção de um tesauro, neste estudo, partiu do princípio de experimentação da metodologia de indexação do sistema PRECIS, já praticado em estudos anteriores. A área de Odontologia foi eleita por não possuir uma linguagem documentária que fizesse o controle de vocabulário da terminologia utilizada na área.
Ao mesmo tempo, existe o interesse e a necessidade da Biblioteca da Faculdade de Odontologia de Bauru/USP em formar um grupo de indexação apto a desenvolver o serviço de indexação, baseado na metodologia de indexação PRECIS do sistema. Dessa forma, outras finalidades nortearam a construção do tesauro:
a) controlar os termos usados na indexação e recuperação da informação, facilitando a comunicação entre usuários e bibliotecários;
b) assegurar uma prática consistente entre diferentes indexadores que atuam no mesmo serviço, ou em serviços diferentes numa rede cooperativa;
c) garantir um bom nível de especificidade na representação do documento, limitando o número de termos necessários e oferecendo um adequado suporte de referências para orientação do usuário;
d) servir como auxiliar de busca na estratégia de recuperação.
2. Antecedentes
PRECIS é um sistema de indexação alfabético de assunto, dotado de uma metodologia própria para construir índices de assunto por computador. Criado pelo Prof. Dr. Derek Austin em 1968, é utilizado desde então pela conceituada instituição britânica BRITISH NATIONAL BIBLIOGRAPHY (BNB) na produção automática de seus índices de assunto. Fundamentados no êxito do PRECIS para a BNB e na excelente estrutura de funcionamento, outros estudiosos de indexação e instituições que abrigam sistemas de informação em diferentes países, desenvolveram a aplicação do sistema demonstrando sua eficiência para diferentes línguas e documentos.
Além disso, o PRECIS como sistema de indexação, descende de um respeitável e já consagrado grupo de estudos de indexação da Inglaterra, o Classification Research Group (CRG), cuja linha teórica de pesquisa baseia-se na classificação facetada de Ranganathan, incluindo também as teorias lingüísticas da gramática gerativo-transformacional de Noam Chomsky e Charles Fillmore.
Com o objetivo de aplicação do sistema PRECIS na língua portuguesa foram realizados, com minha autoria e sob orientação do Prof. Dr. Fredric Michael Lttto (Departamento de Rádio e Televisão da ECA/USP), três relatórios trienais de pesquisa e uma dissertação de mestrado que propiciaram a publicação de um livro e dois artigos de periódicos.
No primeiro relatório de pesquisa (21/05/81 a 21/05/84), foi realizada a aplicação manual do PRECIS, inédito em língua portuguesa, com uma amostra de 60 artigos de periódicos brasileiros, fornecendo importantes subsídios teórico/práticos para desenvolvimento da dissertação de mestrado intitulada "PRECIS na língua portuguesa: uma experiência com a indexação de artigos de periódicos brasileiros", defendida em 1986 na Escola de Comunicações e Artes da Universidade de São Paulo. Pela importância e ineditismo deste estudo no Brasil, a Editora da Universidade de Brasília, em co-edição com a Associação dos Bibliotecários do Distrito Federal, publicaram a dissertação em forma de livro em 1989.
Em continuidade, foi realizado um segundo relatório trienal de pesquisa "Avaliação da eficácia de recuperação do sistema de indexação PRECIS" (maio/84 a dezembro/87), onde foi construído manualmente um catálogo de assunto de biblioteca com 85 livros da área de Biblioteconomia, usando a metodologia de indexação do PRECIS, a fim de proporcionar sua utilização experimental e simulada por 25 usuários e assim avaliar a eficácia de recuperação do catálogo.
A partir do êxito e experiência adquiridos nas pesquisas anteriores, considerou-se importante e inédita a experiência de desenvolvimento de uma metodologia para construção de um tesauro, utilizando o sistema PRECIS.
Portanto, neste projeto de pesquisa trienal propõe-se a aplicação do PRECIS, para executar a compilação e controle de relacionamentos semânticos e lógicos do "corpus" terminológico da área de Odontologia, através da indexação da produção científica da Faculdade de Odontologia de Bauru da USP, contida no periódico "Estomatologia e Cultura" (atual "Revista de Odontologia da USP").
3. Linguagem documentária em Odontologia
Em contatos pessoais efetuados com a Bibliotecária da Biblioteca da Faculdade de Odontologia da USP em Bauru, e com a Professora do Curso de Biblioteconomia da UNESP, Regina Célia Baptista Belluzzo, recebi informações de que na área de Odontologia inexiste uma linguagem documentária, com a necessária especificidade, para efetuar controle de vocabulário na indexação e recuperação de documentos.
Para comprovar a veracidade desta afirmativa, foi realizado, através da aplicação de questionário, um levantamento das condições dos serviços de indexação na realização de controle terminológico em 72 Bibliotecas de Odontologia do Brasil. Tendo obtido resposta de 31 bibliotecas (43%), verificou-se que:
A. Catálogo de assunto:
- 93,54% (29) das 31 bibliotecas possuem catálogo de assunto
B. Controle terminológico
Para construção de catálogos de assunto nessas 31 bibliotecas são utilizados como instrumento de controle terminológico:
a) sistemas de classificação: são utilizados por 31 Bibliotecas (100%)
Classificação Decimal de Dewey: 10 (32,2%)
Classificação Decimal Universal: 9 (29%)
Classificação de Black para Odontologia: 4 (13%)
Classificação Decimal de Dewey para assuntos gerais e Classificação de Black para assuntos específicos: 8 (25,8%)
Total: 31 (100%)
b) listas de cabeçalhos de assunto são utilizadas por 18 Bibliotecas (58%)
listas de cabeçalhos padronizadas: 11 (61%)
listas produzidas pelo próprio sistema: 7 (39%)
c) tesauro é utilizado por 4 Bibliotecas 4 (13%)
d) índices de assunto de obras de referência de Odontologia são utilizados por 12 Bibliotecas (38,7%)
e) textos básicos da área são utilizados por 4 Bibliotecas (13%)
f) dicionários técnicos por 23 Bibliotecas (74 %)
g) Glossários por 9 Bibliotecas (29%)
Para esta questão, o entrevistado pôde assinalar mais de uma alternativa.
C. Necessidade do tesauro em Bibliotecas de Odontologia
Em 100% dessas bibliotecas, os profissionais manifestaram a urgente necessidade de um tesauro de Odontologia como instrumento de controle terminológico, destacando a falta de uniformidade e pouca especificidade das linguagens documentárias utilizadas nessas Bibliotecas.
Considerando os resultados obtidos, é possível concluir que:
o sistema de classificação é a linguagem documentária mais utilizada para controle terminológico;
a indexação dos documentos, dessas Bibliotecas, produz catálogos de assunto através da classificação dos documentos;
o sistema de classificação mais utilizado para controle terminológico é a Classificação Decimal de Dewey em 58% das Bibliotecas;
as listas de cabeçalhos de assunto utilizadas não são específicas de Odontologia, mas de Medicina, uma área inter-relacionada;
a pouca utilização de um tesauro de Medicina (13% das Bibliotecas) evidencia sua inadequação para Odontologia;
é provável a inexistência de um tesauro de Odontologia, pois não foi citado nenhum;
a produção de listas de cabeçalho próprias por 39% dessas Bibliotecas, realizou-se sem a preocupação com uma padronização comum entre elas, mas evidencia a necessidade de uma linguagem documentária específica;
apesar de muito utilizados, os índices de assunto das obras de referência Index to Dental Literature", "Oral Research Abstracts", "Bibliografia Brasileira de Odontologia", não são suficientemente específicos para servirem de parâmetro de controle terminológico em área tão especializada quanto a Odontologia;
a adequação da linguagem documentária com a linguagem do usuário, é feita em apenas 2 Bibliotecas (6,45%) através da colaboração de especialistas;
o serviço de indexação nas Bibliotecas de Odontologia não é formalmente constituído, por não possuir o funcionamento completo de seu fluxo total de operacionalização (análise, determinação de assunto, tradução em linguagem documentária, armazenamento, busca, recuperação, adaptação da linguagem documentária à linguagem do usuário, determinando a política de indexação do sistema;
existe uma necessidade urgente, manifestada com unanimidade pelas Bibliotecas, de possuírem uma linguagem documentária específica, uniformizada e adequada às suas necessidades, tanto de tratamento quanto de recuperação da informação.
Para comprovar mais eficazmente a inexistência de um vocabulário controlado em Odontologia, foi realizado posteriormente um rigoroso levantamento em guias bibliográficos, a saber:
IBICT. Linguagens documentárias utilizadas no Brasil: construídas, traduzidas ou adaptadas. Brasília, 1984.63 f.
IBICT. Tesouros, bibliografia -1970/1982. Brasília: IBICT, 1983. 166 p.
IBICT. Tesouros, bibliografia -1983/1984. Brasília: IBICT, 1985. 89 p.
INTER-ORGANIZATION BOARD FOR INFORMATION SYSTEMS. Bibliography of United Nations thesauri, classifications, nomenclatures. Geneva: IOB, 1979.252 p.
GILBERT, V. A list of thesauri and subject headings held in the Aslib Library. Aslib Proceedings, 31(6):264-267,1979.
Entretanto, durante o levantamento da literatura publicada sobre tesauro, constatou-se a existência de uma dissertação de mestrado, defendida por Malvina Vianna Rosa em 1972 [51], cujo objeto de estudo foi a construção de uma Classificação facetada em Odontologia.
Nesta dissertação, Rosa originalmente construiu um esquema de classificação facetado em Odontologia, que servirá como importante parâmetro teórico/prático para a construção deste tesauro de Odontologia.
Além desse trabalho, foi recuperado um projeto em andamento realizado pelo Subgrupo de Indexação do Grupo de Bibliotecários em Informação e Documentação em Processos Técnicos, que propõe o "Desenvolvimento de uma metodologia para elaboração de um vocabulário controlado em Odontologia: ODONTOVOC" [46], a partir de problemas constatados no catálogo de assunto da Biblioteca do Curso de Odontologia da Universidade Federal do Paraná.
A proposta desta pesquisa, portanto, fundamenta-se, essencialmente, em dois aspectos:
necessidade, para a área de Odontologia, de um controle de vocabulário sob forma de uma linguagem documentária dotada de uma estrutura semântica de termos relacionados;
uso de uma metodologia de indexação que preserve os princípios de "garantia literária" e "garantia de uso", assegurando, ao mesmo tempo, uma padronização, tanto do serviço de indexação quanto da linguagem documentária produzida pelo próprio sistema.
Para o 1° aspecto, propõe-se a construção de um tesauro e para o 2°, a aplicação do sistema PRECIS.
Considerando ainda que a elaboração de um tesauro ou vocabulário controlado exige a aplicação de uma metodologia de indexação dotada de critérios padronizados, a fim de garantir a uniformidade de descritores e, principalmente, que os descritores constantes do tesauro devam ser compatíveis com a linguagem utilizada pelo autor e compreendida pelo usuário, proponho a aplicação do sistema de indexação PRECIS para a elaboração de um tesauro de Odontologia.
Por outro lado, a aplicação do PRECIS em Odontologia seria um estudo totalmente inédito, uma vez que a literatura mundial publicada sobre o sistema não menciona nenhum outro estudo semelhante.
4. O tesauro como linguagem documentária
4.1. A evolução do tesauro
Os tesauros têm como antecedentes as classificações gerais de assunto e depois as classificações mais especializadas. Com o crescimento no final da década de 50 da atividade científica e técnica e o conseqüente aumento da literatura, as bibliotecas viram-se obrigadas a preocupar-se mais com a especificidade dos assuntos. Ao mesmo tempo, começavam com Luhn as primeiras tentativas de desenvolvimento de métodos automatizados para armazenamento e recuperação da informação.
Estas condições, mais os princípios classificatórios de Ranganatham e depois os do Classification Research Group (CRG), propiciaram a criação do tesauro.
O primeiro tesauro empregado para controlar o vocabulário de um sistema de recuperação foi desenvolvido pela organização Du Pont em 1959. Simultaneamente, apareceram outros tesauros com maior difusão:
"Thesaurus of Astia Descriptor" (1960)
"Medical Subject Headings" (1960)
"Chemical Engineering Thesaurus" (1961)
"Thesaurus of Engineering and Scientific Terms" (1967)
Atualmente, existem inúmeros tesauros em permanente evolução e especialização de acordo com o crescimento científico e técnico.
4.2. A função do tesauro no processo de indexação
O processo de indexação compreende as etapas de análise de assunto, seleção de conceitos e a tradução dos conceitos em linguagem de indexação.
O tesauro, como linguagem de indexação ou documentária, funcionará na etapa de tradução, como instrumento de controle de vocabulário na intenção de indicar relacionamentos semânticos entre termos, uniformizar a utilização de termos sinônimos e homônimos e assegurar a forma e a ordem de escrita das palavras.
É dinâmica e flexível, permitindo a inclusão, exclusão e modificação de termos a qualquer tempo em permanente interação com o contexto temático do "ambiente" em que atua.
4.3. A necessidade de um tesauro
Geralmente, o profissional bibliotecário encara o tesauro como um instrumento sofisticado e importante, mas não sabe muito bem por que deveria usá-lo em sua Biblioteca.
O tesauro é também visto como instrumento útil somente para sistemas muito especializados. Aliás, quando se fala em tesauro, é fácil imaginar todo o contexto de um grande centro de informação dotado de um bem montado serviço de indexação com equipe especialmente treinada.
Entretanto, o tesauro não é exclusivo de sistemas de informação especializados. Ocorre que, como as bibliotecas não desenvolvem um serviço de indexação com metodologia sistematizada para propiciar um nível quantitativo/qualitativo de recuperação, o tesauro não é necessário.
A bem da verdade, "um sistema que não usa tesauro é baseado na premissa de que palavras têm significados precisos e assim não há necessidade na extração de qualquer outro significado do contexto" [13].
Dessa forma, uma mesma palavra deve ter sempre igual significado para o indexador e para o usuário. Quando isto não acontece, o documento não é recuperado e o sistema falha. O sistema também falha quando faz combinações indesejáveis com os termos, propiciando a recuperação de documentos indesejáveis.
Existe, portanto, a necessidade de usar um instrumento que possa controlar o vocabulário usado na indexação e na recuperação.
A grande vantagem do tesauro, enquanto controle de vocabulário, é proporcionar a mesma orientação para o indexador e o usuário, de tal modo que ambos selecionem o mesmo termo para representar um conceito particular do assunto.
Além da imprecisão das palavras, o tesauro é também necessário no controle de números ou sinônimos e mudança de terminologia em áreas de assunto com rápida evolução.
Um sistema sem controle de vocabulário tem a vantagem do baixo custo, mas, ao contrário, tem a séria desvantagem da baixa recuperação, tornando-o um sistema pobre. Os principais problemas que ocorrem são:
sinônimos: se uma palavra-chave selecionada possui vários sinônimos, diferentes indexadores (ou o mesmo indexador em momentos diferentes) podem indexar documentos semelhantes com termos diferentes;
homônimos: existem palavras escritas da mesma forma, mas inteiramente diferentes em significado. O indexador poderá indexar dois documentos com assuntos diferentes usando um mesmo termo que resultará na recuperação de documentos indesejáveis.
Outros problemas mais comuns decorrentes da adoção de linguagem livre, sem uso de tesauro, são:
genérico/específico: um documento é indexado com um termo de indexação específico e o usuário faz a busca pelo termo genérico ou vice versa;
sintaxe: uso de palavras em ordem imprópria;
ortografia: uma palavra é escrita de forma diferente quando a coleção da biblioteca é formada com publicações de diferentes países.
Todos estes problemas serão solucionados com o uso de um bom tesauro, que indicará qual termo deve ser usado entre diversos sinônimos; distinguirá diferentes homônimos; demonstrará os relacionamentos semânticos entre os termos e especificará a ordem e a forma correta das palavras.
4.4. A construção do tesauro: antes ou depois da indexação?
Quando um sistema decide usar tesauro, será desejável investigar a existência de um que seja compatível com a área de assunto a ser indexada. Apesar da compatibilidade de assunto, necessariamente o tesauro deverá sofrer adaptações em função da linguagem dos documentos e do usuário, e quando não existe, deverá ser construído.
Mas qual o momento certo para construir ou adaptar o tesauro?
A resposta desta questão expõe, inicialmente, três alternativas propostas por Suddar-shan. [55]
a) indexar um bom número de documentos sem controle de vocabulário para compilação de termos e, juntamente, com os termos coletados de dicionários, diretórios, etc., construir o tesauro. Quando o tesauro estiver pronto, será usado para indexar os outros documentos e novamente os já indexados;
b) construir um tesauro completo coletando termos de várias fontes: dicionários, diretórios, periódicos, livros, outros tesauros relacionados com a área, etc., e depois usá-lo para a indexação dos documentos;
c) indexar os documentos e construir o tesauro simultaneamente.
No primeiro método, a qualidade do tesauro é superior, uma vez que se utilizará dos termos da própria coleção de documentos. Por outro lado, terá a séria desvantagem de re-indexação da mesma coleção.
No segundo método, não existe o problema de re-indexação, contudo, o breve período de coleta de termos e a quantidade limitada de fontes terminológicas prejudicarão a qualidade do tesauro. Além disso, haverá um tempo de espera antes da indexação da coleção.
O terceiro método abriga a vantagem de reunir as qualidades e eliminar as limitações dos dois métodos. Para acionar o funcionamento simultâneo da indexação e construção do tesauro, é preciso que o serviço de indexação trabalhe em dois grupos: tesauro e indexação.
o grupo do tesauro será formado antes e iniciará a construção preliminar do tesauro, que deverá ser incrementado com o avanço dos trabalhos do 2° grupo;
o grupo de indexação será formado após a construção do tesauro preliminar, devendo iniciar a indexação em permanente interação com o 1 o grupo, alimentando a estrutura do tesauro com termos de indexação.
4.5. O uso do tesauro em Odontologia
O presente estudo propõe, tal como o 3° método, a realização de um tesauro preliminar, construído a partir da indexação com PRECIS, da produção científica da Faculdade de Odontologia de Bauru/USP contida no periódico "Estomatologia e Cultura" (atual Revista de Odontologia. USP).
Partiu-se da premissa, portanto, que o tesauro preliminar de Odontologia seria qualitativamente melhor com termos de indexação provenientes da linguagem científica do usuário.
Além disso, uma vez pronto, este tesauro daria início aos trabalhos de indexação do grupo de indexadores da Biblioteca da Faculdade de Odontologia de Bauru/USP.
O trabalho de indexação deste grupo será iniciado com o acervo de separatas existentes nos Departamentos de Ensino da Faculdade. Fundamentado na metodologia do sistema PRECIS, o serviço de indexação executará a análise de assunto, seleção de conceitos e tradução desses conceitos utilizando o tesauro de Odontologia como controle da terminologia.
4.6. A estrutura do tesauro
Os tesauros aparecem como resultado do desenvolvimento dos dicionários ideográficos, em que os termos eram empregados para descrever conceitos e organizados alfabeticamente.
Porém, um tesauro difere de uma lista de autoridade pela sua capacidade de demonstrar as relações estruturais entre os termos, expressando explicitamente o tipo de relação. Isto significa que os termos de um tesauro são classificados segundo uma ordem hierárquica existente na área de assunto, com a finalidade de oferecer uma visão geral do assunto.
A estrutura do tesauro contém uma ordenação sistemática de conceitos com indicação das relações básicas que ligam os termos nele incluídos.
De acordo com a normalização vigente para a elaboração de tesauro monolíngüe da ISO 2788-1986 [11], existem três classes gerais de relacionamento:
4.6.1. Relacionamento semântico ou de equivalência
É o relacionamento entre termos preferidos e não-preferidos, na qual dois ou mais termos designam o mesmo conceito. A reciprocidade é expressa por:
USE, precedendo o descritor
UP, ("usado por"), precedendo o não-descritor
Ex.: EXODONTIA
up Extração de dente
Extração de dente
USE EXODONTIA
As relações de equivalência incluem:
a) sinônimos
b) quase-sinônimos: termos intimamente relacionados que, para propósitos de indexação, são considerados sinônimos.
4.6.2. Relacionamentos lógicos
4.6.2.1. Relação hierárquica:
demonstra os graus de superordenação (categoria/ classe/todo) e de subordinação (membro/parte) entre os conceitos.
a reciprocidade é expressa pelas seguintes abreviaturas
TG (termo genérico) precede o termo superordenado.
TE (termo específico) precede o termo subordinado.
Ex.: PERIODONTIA
TG ODONTOLOGIA
ODONTOLOGIA
TE PERIODONTIA
a) relação genérica: identifica a ligação entre uma classe ou categoria de conceitos e cada um de seus membros.
b) relação hierárquica todo/parte: abrange número limitado de classes de termos, em que o nome da parte subentende o nome do todo. Isto se aplica às quatro principais classes de termos:
sistemas e órgãos do corpo
localidades geográficas
disciplinas ou áreas do discurso
estruturas sociais hierarquizadas
4.6.3. Relação associativa:
ocorre entre termos que não são equivalentes e tampouco formam uma hierarquia, mas são tão associados mentalmente que esta relação deverá ser esclarecida no tesauro
Ex: DENTES
TA ODONTOLOGIA
ODONTOLOGIA
TA DENTES
4.7. Apresentação gráfica do tesauro
De acordo com a ISO 2788-1986, os termos e seus inter-relacionamentos são apresentados basicamente através de três métodos:
a) apresentação alfabética, com notas de aplicação e relacionamentos para cada termo;
b) apresentação sistemática com índice alfabético;
c) apresentação planográfica com índice alfabético.
Para a construção deste tesauro, decidiu-se pela escolha da apresentação sistemática com índice alfabético. A escolha da ordenação sistemática foi decidida em função da necessidade de uma categorização sistemática da terminologia de Odontologia atualmente inexistente, a não ser pela Classificação de Black [9] e Classificação facetada de Odontologia de Malvina Vianna Rosa [51].
Pela ordenação sistemática, o tesauro será apresentado em duas partes:
Parte sistemática: relação de categorias ou hierarquias de termos ordenados de acordo com seus significados e relacionamentos lógicos;
Parte alfabética: índice alfabético que levará o usuário à parte apropriada da seção sistemática.
5. Construção do tesauro de Odontologia: materiais e métodos
Após decidir pela apresentação sistemática, o trabalho de construção do tesauro obedecerá uma seqüência lógica de etapas, comuns a maioria dos métodos e embasada em princípios gerais de acordo com a normalização determinada pela ISO 2788-1986. [11]
É importante observar que essa norma foi preparada por Derek Austin, autor do PRECIS, e sua abordagem é totalmente compatível com a metodologia de construção da rede semântica usada pelo sistema PRECIS.
5.1. Compilação de termos
Existem duas abordagens de compilações possíveis:
a) método dedutivo : os termos são extraídos da literatura durante o estágio preliminar de indexação e analisados, posteriormente, por uma comissão de indexadores e especialistas para decidir quais termos representarão as classes mais amplas e a inclusão dos demais termos dentro das classes com seus inter-relacionamentos lógicos;
b) método indutivo : a construção do tesauro por este método é considerada, desde o início, como uma operação contínua. À medida que novos termos são encontrados na literatura, são admitidos no tesauro e designados, cada um como membro de uma ou mais classes, estabelecidas em base "ad-hoc" durante a indexação. O auxílio do especialista é solicitado sempre que necessário, sem compor uma comissão formal.
Considerando a decisão inicial de aplicação da metodologia do sistema PRECIS na indexação prévia de um corpus documentário, decidiu-se, neste trabalho, pela abordagem dedutiva para a compilação dos termos integrantes do tesauro preliminar.
A avaliação de especialistas será feita quando necessária, tal como no método indutivo.
Após a construção deste tesauro preliminar, pretende-se que o serviço de indexação adote o método indutivo combinado com o dedutivo.
5.1.1. Material para compilação
O corpus documentário selecionado para a indexação e compilação foi a produção científica dos docentes da Faculdade de Odontologia de Bauru da USP, contida no periódico "ESTOMATOLOGIA E CULTURA" (atual Revista de Odontologia da USP), publicado pela referida Instituição.
A coleção do referido periódico inicia-se em 1967, e até 1989 foram publicados 44 fascículos contendo 538 artigos, todos indexados pela metodologia do sistema PRECIS.
5.1.2. Indexação PRECIS para compilação
Além da compatibilidade metodológica do PRECIS com a normalização vigente para construção do tesauro, o sistema assegura com flexibilidade o padrão uniforme de indexação para diferentes indexadores ao mesmo tempo e em períodos de tempo diferentes.
O uso da metodologia do sistema consistiu na aplicação da parte sintática para a indexação dos 538 artigos, obtendo-se entradas de assunto, das quais foram selecionadas 1012 termos para a construção do tesauro.
PRECIS é um sistema dotado de dois conjuntos de procedimentos: sintaxe e semântica . O primeiro conjunto de procedimentos —a parte sintática do sistema— atua como "gramática" dos termos nas entradas. O segundo conjunto de procedimentos - aparte de tesauro do sistema - atua no estabelecimento de classes de significados entre termos individuais (ligação de sinônimos, termos genericamente superiores e termos que formam relações associativas com os termos que ocorrem na mente do usuário). Ambos foram especialmente criados para agirem como método de indexação: a parte sintática constitui-se na função do indexador de construção da cadeia de termos, um processo de determinação da ordem sintática e arranjo de termos de tal modo que o computador produzirá as entradas requeridas; a parte semântica envolve a produção das referências ver e ver também para o termo utilizado.
Tanto a parte sintática como a parte semântica são constituídas de um conjunto de operadores de função, que caracterizam a posição e o significado dos termos de acordo com o contexto do enunciado de assunto do documento analisado. Cada operador possui função sintática ou semântica específica e constitui-se numa instrução de computador que, quando utilizada, aciona automaticamente a posição, função e tipografia do termo em uma entrada de assunto.
A sintaxe do PRECIS é formada pelo formato e estrutura das entradas no índice e pela gramática baseada em um esquema de operadores de função.
Esquema de operadores de função usado no PRECIS
Operadores principais
ambiente do sistema observado A |
0. Localização |
1. Sistema-chave: objeto de uma ação transitiva; agente de ação intransitiva;
2. Ação/efeito;
3. Agente de uma ação transitiva: aspectos; fatores; |
dados relatados para o observador
exemplos selecionados
apresentação de dados
Operadores interpostos
elementos dependentes
Conceitos de ligação
Conceitos coordenados
B |
4. Ponto de vista como forma; |
| 5. Amostra de população/região de estudo; |
| 6. Objetivo/forma; |
p. Parte/propriedade
q. membro de um grupo quase-genérico (classe não-hierárquica);
r. Agregado; |
s. Definidor de função;
t. Associação atribuída pelo autor; |
| g. Conceito coordenado; |
Operadores de diferenças
termos compostos
(prefixados por $)
OBS.: não são usados em português
os operadores h, i, j, k, m
Conectivos
(Componentes de ligação
das frases prefixadas por $)
C |
h. Diferença direta não-guia;
i. Diferença direta-guia;
j. Diferença a ser evidenciada;
k. Diferença indireta não-guia;
m. Diferença indireta guia;
n. Diferença não-guia a ser explicada;
o. Diferença guia a ser explicada; |
v. Conector de leitura descendentes;
w. Conector de leitura ascendente; |
Ligação de temas;
Ligação entre os termos, elos. |
x. Primeiro elemento no tema coordenado;
y. Elemento subseqüente no tema
coordenado;
z. Elemento de tema comum. |
Os operadores de função atribuídos aos termos extraídos do documento formarão uma cadeia organizada em seqüência lógica, sob os preceitos da gramática do PRECIS, assegurando a uniformidade de organização para diferentes indexadores. Seus valores numéricos crescentes indicam a ordem dos termos nas entradas, além de determinar a tipografia, a pontuação e o formato das entradas.
Exemplo:
ABDO, R.C.C.; MACHADO, MA. de A.M.; PAVARINI, A. Profilaxia prévia à aplicação tópica de flúor, sim ou não? uma revisão. Rev. Odont. USP, 2(3): 172-174, 1988.
CADEIA PRECIS:
(1) cárie dental
(2) prevenção $w de
(3) aplicação $v de $w para
(4) flúor
ENTRADAS DE ASSUNTO:
CÁRIE DENTAL
Prevenção. Aplicação de flúor
PREVENÇÃO. Cárie dental
Aplicação de flúor
FLÚOR
Aplicação para prevenção de cárie dental
TERMOS DO TESAURO: Todos os termos guias que serviram como entrada de assunto no índice:
CÁRIE DENTAL; PREVENÇÃO; FLÚOR
5.2. Organização da estrutura do tesauro
Esta etapa está sendo desenvolvida através da realização das seguintes etapas:
a) registro dos termos de indexação:
Todos os termos compilados na indexação foram registrados cada qual em uma ficha para formar um arquivo em ordem alfabética. Este arquivo foi posteriormente reproduzido mais duas vezes, obtendo-se:
ARQUIVO 1: Termos em ordem alfabética;
ARQUIVO 2: Classificação dos termos por disciplinas de Odontologia;
ARQUIVO 3: Classificação dos termos em facetas
b) Controle terminológico dos termos
Para estabelecimento de relações semânticas, lógicas e associativas entre os termos, todos passaram pelo controle terminológico. Foram utilizados dicionários especializados para determinação de relações semânticas, sendo registrada a definição de cada termo na ficha respectiva.
Os relacionamentos lógicos e associativos foram estabelecidos mediante consulta a especialistas, textos básicos da área, Classificações decimais de Dewey e Universal, Classificação de Black, Classificação facetada de Odontologia e índices de assunto das obras de referência de Odontologia.
c) Estruturação das partes sistemáticas e alfabéticas (em andamento)
6. Considerações finais
A finalização desta pesquisa deverá ocorrer quando o tesauro preliminar de Odontologia for testado e ajustado para uso. Pretende-se que o teste seja feito pela comunidade docente da Faculdade de Odontologia de Bauru/USP, quando for iniciado o projeto de implantação do serviço de indexação da Biblioteca.
Portanto, a implantação, teste e uso deste tesauro é uma etapa final deste projeto e inicial de um projeto maior que consiste na consolidação de um serviço de indexação automatizado, utilizando o tesauro deste projeto e a metodologia de indexação do PRECIS.
Para a automação do serviço de indexação, será construída urna base de dados bibliográfica de documentos da Biblioteca, mediante utilização do PRECIS software que, também, deverá gerar as entradas de assunto do índice e propiciar a busca e recuperação das referências bibliográficas em tela e listagem para todos os Departamentos de ensino da Faculdade de Odontologia.
PRECIS software é um programa de computador totalmente compatível com a metodologia de indexação do PRECIS, idealizada por Derek Austin, para a geração automática do índice de assunto da British National Bibliography.
O programa do PRECIS está sendo elaborado através de um projeto de pesquisa financiado pelo CNPq, a fim de viabilizar a aplicação automática do PRECIS sob diversas condições experimentais e propiciar sua ampla utilização por sistemas de informações brasileiros e, ainda, propiciar a construção de vocabulários melhor compatibilizados com a linguagem do autor e do usuário brasileiro.
Quando o serviço de indexação estiver funcionando com a metodologia e o programa do PRECIS, o tesauro, em constante reformulação pelo sistema, será o instrumento fundamental de compatibilidade terminológica entre o sistema e o acervo documentário indexado.
7. Bibliografia
[1] - ATTICHISON, J. & GILCHRIST, A. Manual para construção de tesouros; trad. de Helena Medeiros Pereira Braga. Rio de Janeiro: BNG/BRASELART, 1979. 142p.
[2] - AUSTIN, D. PRECIS: a manual of concept analysis and subject indexing. Londres: Council of the British National Bibliography, 1974. 551p.
[3] - _____. PRECIS as a multilingual system: a search for language independent explanations. Londres: Department of Information Studies, University of Sheffield, 1982. (Degree of Philosophical Doctor).
[4] - _____. The development of PRECIS: a theoretical and technical history. Journal of Documentation, 30(1): 47-102, 1974.
[5] - ______ & DYKSTRA, M. PRECIS: a manual of concept analysis and subject indexing. 2. ed. Londres: The British Libray, 1984.
[6] - ______ & VERDIER, V. String indexing: PRECIS introduction and indexing. London, Ont.: School of Library and Information Science, University of Western Ontario, 1977.
[7] - BIBLIOGRAFIA BRASILEIRA DE ODONTOLOGIA. Lista de assuntos inglês-português.
[8] - BIBLIOGRAFIA BRASILEIRA DE ODONTOLOGIA. Lista de assuntos português-inglês.
[9] - BLACK, A.D. Classification for dental literature. Chicago: American Dental Association, 1955.
[10] - BORBA, F. da S. Pequeno vocabulário de lingüística moderna. São Paulo: Nacional/EDUSP, 1971. 149p.
[11] - BRITISH STANDARDS INSTITUTION. British Standard guide to establishment and development of monolingual thesauri. Londres: BSI, 1987, 32p. (BS 5723:1987; ISO 2788-1986)
[12] - CUNHA, C. Gramática do português contemporâneo. Belo Horizonte: Bernardo Álvares, 1969. 509p.
[13] - DEVADASON, F. J. & BALASUBRAMANIAN, V. Computer generation of thesaurus from structured subject-propositions. Information Processing & Management , 17(1): 1-11, 1981.
[14] - DICIONÁRIO Brasileiro de Odontologia. São Paulo: E.B.O., 1986. 225p.
[15] - DICIONÁRIO de termos usados em Odontologia, s.l.: MEC/Academia Brasileira de Odontologia, 1971.
[16] - DOBEDEI, V.LD.L. de M. Construção de thesauri: experimento empírico para a coleta de termos em formação profissional. Rio de Janeiro: UFRJ/IBICT, 1979. 127p. (Dissertação de mestrado)
[17] - DOVBENKO, MA. & UMANSKI, A.N. A comparative analysis of information retrieval thesauri and normalised scientific and technical terminologies with the aim of their coordinated development. Int. Fórum Inf. Do., 5(4):9-11, 1980.
[18] - DYKSTRA, M. PRECIS: a primer. Londres: Scarecrow Press; Metuchen, N J., 1987.
[19] - FUJITA, M.S.L. Avaliação da eficácia de recuperação do sistema de indexação PRECIS. Ciência da Informação, 18(2):120-34, 1989.
[20] - ________. PRECIS na língua portuguesa: teoria e prática de indexação. Brasília: Editora da Universidade de Brasília, 1989.
[21] - ________. PRECIS software: indexação automática de documentos. Marília: UNESP, 1990. (Projeto de pesquisa em andamento financiado pelo CNPq).
[22] - ________. Sistema de indexação PRECIS I: PRECIS: prospectiva histórica e técnica de seu desenvolvimento e aplicação. Revista Brasileira de Biblioteconomia e Documentação, 21(1/2)21-45, 1988.
[23] - ________. Sistema de indexação PRECIS II: PRECIS em língua portuguesa. Revista Brasileira de Biblioteconomia e Documentação, 21(3/4):7-33, 1988.
[24] - GARCIA, M. B. & MONFASANI, R. E. Tesauro argentino de Psicologia. Revista Española de Documentación Científica, 7(3):229-232, 1984.
[25] - GILBERT, V. A list of thesauri and subject headings held in the Aslib Library. Aslib Proceedings, 31(6):264-267, 1979.
[26] - GUSMÃO, H.R. Tesouros: análise e utilização. Niterói: CEFF, 1985. 126p.
[27] - HAYNES, D. Thesaurus construction using a micro. Library Micromation News, 13(jul.):8-12, 1986.
[28] - INDEX to dental literature. Dental descriptors; alphabetical listing.
[29] - INSTITUTO BRASILEIRO DE INFORMAÇÃO EM CIÊNCIA E TECNOLOGIA. Diretrizes para elaboração de tesouros monolíngües, projeto coordenado por Hagar Espanha Gomes. Brasília: IBICT, 1984. 70p. (Publicação baseada na BS5723:1979)
[30] - _____. Linguagens documentárias utilizadas no Brasil; construídas, traduzidas ou adaptadas. Brasília: IBICT, 1984. 63f.
[31] - _____. Tesouros: bibliografia 1970/1982. Brasília: IBICT, 1983. 163p.
[32] - _____. Programa de elaboração de tesouros em microcomputador (TECER). Brasília: IBICT, 1989. 76p.
[33] - INTERNATIONAL ORGANIZATION FOR STANDARDIZATION. Documentation - Methods for examining documents, determining their subjects and selecting indexing terms. Suíça: ISO, 1985. 5p. (ISO5963- 1985E)
[34] - _____. Documentation - Guidelines for the establishment and development of monolingual thesauri. Suíça: ISO, 1986. 33p.
[35] - KAHALAN, T.H. Storing dental knowledge; classification and subject headings. Bull. Med. Libr. Assoc. 46:96-102, 1958.
[36] - LEATHERDALE, D. & GALRAO, M.J. La construcción de vocabularios controlados. Revista AIBDA, 1(1):1-16, 1980.
[37] - LOZANO, R. S. Los tesauros de términos científicos y técnicos en general y especialmente. Revista Española de Documentación Científica, 8(l):17-55,1985.
[38] - MAHAPATRA, M. & BISWAS, S.C. Efficiency of PRECIS role operators. International Library Review, 16: 299-307, 1984.
[39] - ________ & _______. Interdependence of PRECIS role operators: a quantitative analysis of their associations. JASIS, 37(1):20-25, 1986.
[40] - MARINET, A. Conceitos fundamentais de lingüística. Lisboa: Presença, 1976. 461p.
[41] - MAYA-MONTALVO, LA. Proposta de procedimentos metodológicos para a elaboração de tesouros facetados. São Paulo: ECA/USP, 1986. 245p. (Tese de Doutorado)
[42] - MOTTA, D. F. Método relacional como nova abordagem para a construção de tesouros . Rio de Janeiro: UFRJ/IBICT, 1986. 210p. (Dissertação de Mestrado)
[43] - NAKAYAMA, H. Tradução e adaptação de tesauros. Ciência da Informação, 15(1): 15-16, 1986.
[44] - OLIVEIRA, L. de L. e. Construção de um thesaurus para indexar prontuários médicos no campo da cardiologia. Rio de Janeiro: UFRJ/EBICT, 1987. 217p. (Dissertação de Mestrado)
[45] - ORUMA, B. Developing the nigerian agricultural thesaurus. Bull. Int. Ass. Agric. Libr. Doc., 27(4): 111-115, 1982.
[46] - PAZIN, R.A.A.P. et allii. "Desenvolvimento de uma metodologia para elaboração de um vocabulário controlado em Odontologia: ODONTOVOC". In: CONGRESSO BRASILEIRO DE BIBLIOTECONOMIA E DOCUMENTAÇÃO. 14. Anais. Recife, 1987. v.2.
[47] - PEREIRA, A. Dicionário de sinônimos odontológicos. Rio de Janeiro: Científica, 1956. 332p.
[48] - RAMSDDEN, M.J. PRECIS: a workbook for students of librarianship. London: Clive Bingley, 1981. 152p.
[49] - RAO, C. Thesaurus of cell biology. Library herald, 22(4):217-220, 1984.
[50] - RICHMOND, PA. Introduction to PRECIS for north america usage. Colorado: Libraries Unlimited, 1981. 321p.
[51] - ROSA M.V. Classificação facetada em odontologia. Porto Alegre: UFRJ/IBICT, 1972. 142p. (Dissertação de Mestrado)
[52] - SCARTEZZINI, C. Dicionário odontológico. 3.ed.rev.atual. Rio de Janeiro: Científica, 1964. 127p.
[53] - SERRANO, N.G.B. Modelo de um thesarofacet em arquitetura. Rio de Janeiro: UFRJ/IBICT, 1979. 146p. (Dissertação de Mestrado)
[54] - SEVELIA, L.G. et alii. El tesauro como base de un sistema de documentación: su aplicación en psicología. Revista Española de Documentación Científica, 6(2):129-135, 1983.
[55] - SUDARSHAM, B. Development of reference retrieval system with simultaneous building up of thesaurus for industrial information centres. Library Science with slant of Documentation, 16(3):77-83, 1979.
[56] - TAYLOR, A. McCORDICK, I. & BURNHAM, B. A computer based catalogue linking the PRECIS subject indexing system to school library materials: building a model for an Ontario-wide information network for school libraries using PRECIS: a developmental research project. Aurora, Ont.: York Country Board of Education, 1978. 48p.
[57] - UNESCO. Diretrizes para a elaboração e desenvolvimento de thesauri monolíngües destinados à recuperação de informações. Trad. António Agenor Briquet de Lemos. Brasília: UnB/Departamento de Biblioteconomia, 1973.
[58] - UNISIST. Princípios de indexação. R. Esc. Biblioteconomia. UFMG, 10(l):83-94, mar. 1981.
[59] - UNIVERSIDADE DE SÃO PAULO. Faculdade de Odontologia de Bauru. Catálogo de rubricas de assunto da Biblioteca.
[60] - VAN SLYPE, G. Linguagem documentária e lingüística. Trad. Cordélia R. Cavalcanti. Brasília: UnB/Departamento de Biblioteconomia, 1983.
[61] - WALL, E. Vocabulary building and control techniques. American Documentation, :161-4, April 1969.
[62] - WELLISCH, H. A flow chart for indexing with a thesaurus. J. Am. Soc. Inf. Sc., : 185-94, may-jun. 1972.
[63] - ________., ed. The PRECIS index system: principles, applications and prospects. INTERNATIONAL PRECIS WORKSHOP - Proceedings. University of Maryland, oct. 15-17,1976. New York: H.W. Wilson, 1977. 204p.
[64] - YERKEY, AN. A preserved context indexing system for microcomputers: PERMDEX. Information Processing & Management, 19(3):165-71, 1983.
|