|
Uso de ferramentas automatizadas
para expandir procedimentos de indexação
e classificação através do uso de bancos de termos
Roseane R. Velho Lopes
Fundação de Ciência e Tecnologia
Brasil
Resumo
O uso de bancos de termos incorporado ao ambiente processador de documentos e informações e introduzido como uma alternativa para aperfeiçoar o acesso e a recuperação de material documentário e informativo, onde os sistemas de indexação e classificação cessam de fornecer auxílio. Tais softwares de apoio necessários para fornecer melhores perfis para documentos e informações podem também ser oferecidos como um novo serviço a ser prestado aos usuários. Portanto, precisão e profundidade podem ser obtidas para uma descrição mais dinâmica de material de cunho documentário e informativo, através de descritores e palavras-chave originados a partir da linguagem natural que podem ser controlados dentro de parâmetros flexíveis pelo cientista da informação. Esta constitui uma ferramenta para o cientista da informação e um novo aspecto do serviço de fornecimento de informações e documentos a ser oferecido para a comunidade.
1. Introdução
A facilidade e velocidade com as quais a ciência e a tecnologia estão unindo e sobrepondo áreas do conhecimento, constituem um grande desafio para os cientistas da informação encarregados de atualizar e otimizar os procedimentos de classificação e indexação ora existentes em seus esforços de projetar sistemas em linha para recuperação de documentos e informações que sejam mais efetivos, acurados e amigos do usuário. Mais e mais, novos conceitos estão sendo criados para serem transformados em termos técnicos e científicos. Isto leva a problemas de homonímia, sinonímia ou de adoção indiscriminada de termos estrangeiros ao vernáculo, prejudicando a comunicação e constituindo uma barreira para a descrição acurada de material de cunho documentário e informativo. A nível multilíngüe, estes problemas ainda são mais aparentes, pois a flexibilidade para a formação de palavras varia entre as linguagens naturais, criando uma situação delicada e não raras vezes frustrante, para o qual cientistas da informação, encarregados de classificar material multilíngüe de cunho científico-tecnológico principalmente (Velho Lopes, 1987). Uma alternativa para auxiliar o cientista da informação nesses casos é fornecer ao usuário descritores que mais se aproximem de sua própria linguagem natural, constituir a incorporação de bancos de termos ao ambiente de trabalho, como veremos a seguir.
2. Problemas de classificação: perspectiva do usuário e do cientista da informação
Do ponto de vista do usuário, as queixas mais comuns com relação ao sistema de recuperação de documentos e informações, quer seja ele automático ou não, constituem: a) o ambiente processador de documentos e informações não possui o material desejado, ou b) possui, mas está localizado em local errado. Em outras palavras, o sistema de classificação empregado utilizou outro descritor que não foi reconhecido pelo usuário. Isto ocorreu porque normalmente os procedimentos de classificação empregados não conseguem acompanhar a rápida fusão dos campos científicos e tecnológicos que estamos presenciando atualmente, e de cujo conhecimento o usuário é possuidor.
Do ponto de vista do cientista da informação, ocorre a frustração por este saber de antemão que o perfil fornecido para o material classificado já está, em princípio, incompleto. Se o ambiente processador de documentos c informações também lida com material estrangeiro, pode ocorrer a inexistência do novo campo de especialização no vernáculo do idioma considerado. O cientista da informação, neste caso, possui auxílio para realizar suas tarefas de forma a obter os melhores resultados.
Este fenômeno comum e raramente entendido pelos usuários de sistemas de documentos e informações, que geralmente têm justificados seus preconceitos sobre o desempenho dos mesmos, quer sejam estes representados pelas bibliotecas tradicionais ou por sistemas automatizados, e constitui fonte de frustração para os cientistas da informação cuja meta principal consiste no projeto e gerenciamento de sistemas mais eficientes, precisos e amigos do usuário.
Deve-se chamar a atenção dos cientistas da informação encarregados de procedimentos de classificação de que os usuários, via de regra, usam linguagem natural, ou seja, o seu idioma pátrio para interagir com o sistema, quer seja ele automático ou não. O cientista da informação, por outro lado, emprega procedimentos de indexação e classificação que são provenientes da linguagem natural, mas constituem, necessariamente, o espelho destas. Os procedimentos de classificação e indexação devem, obviamente, ser prescritivos, mas também atuar como elemento visível para o usuário. Este último requisito é essencial para que o cientista da informação desempenhe suas funções a contento do usuário. Portanto, é nesse contexto que a lingüística computacional, a terminologia, a ciência e a tecnologia da informação e a tradução devem unir esforços e oferecer novas técnicas para auxiliar na resolução de alguns dos problemas mencionados anteriormente. Bancos de termos projetados com softwares de apoio bastante simples podem-se constituir numa preciosa ferramenta de apoio para os cientistas da informação encarregados de procedimentos de classificação, além de poderem ser oferecidos como um novo serviço prestado aos usuários.
3. Bancos de termos
Os dicionários impressos, tanto técnico quanto de caráter geral, apresentam a desvantagem de já estarem desatualizados mesmo logo após terem sido impressos devido a rapidez com que novos termos estão sendo formulados principalmente nas áreas científico-tecnológicas, o mesmo fenômeno ocorrendo com a atualização dos procedimentos de classificação e indexação. Quando, por outro lado, palavras e termos são armazenados em dispositivos automáticos através do uso de softwares de apoio, alguns deles extremamente simples de serem projetados, os procedimentos de compilação, armazenagem e atualização podem ser otimizados com maior facilidade e precisão, de forma que se aproximem dos processos lingüísticos dinâmicos de formação de termos e palavras, possuídos pelas linguagens naturais.
Basicamente, bancos de termos colecionam e armazenam definições, conceitos e termos, podendo fornecer informações de forma mais rápida e consistente do que os dicionários impressos disponíveis no mercado. Bancos de termos podem também conter mais dados sobre os processos lingüísticos que levaram a formação daquele termo específico. Bancos de termos também disseminam palavras, conceitos, definições, dentre outros dados, eletronicamente, e podem fornecer acesso em linha a usuários interessados em constituir uma ferramenta valiosa para a coleta de vocabulário, principalmente para fins de normalização. Para o cientista da informação, os bancos de termos são de extrema utilização, especialmente no caso do material de difícil classificação ou catalogação, devido ao fato de que a área considerada ainda não ter sido adequadamente coberta pelos procedimentos de classificação e catalogação disponíveis. Neste caso, bancos de termos incorporados ao ambiente processador de documentos e informações podem auxiliar o profissional fornecendo o conceito, a definição e o escopo do material informativo, sendo que estes dados são postos imediatamente a disposição do usuário para consulta, em caso de dúvida, ou mesmo sugestão de expansão de sentido do termo considerado, caso o usuário assim sugerir e concordar com o fato o profissional competente.
A tarefa de projeto e gerenciamento de um banco de termos, incorporado ao ambiente processador de documentos e informações também fomenta a integração dos trabalhos de cientistas da informação, lingüistas e usuários, que também podem ser eles mesmos a fonte de novos termos e descritores a serem incorporados ao sistema. Além do mais, questionar o usuário a respeito de aspectos terminológicos e de classificação constitui uma forma de compartilhar com ele a responsabilidade pela manutenção do sistema de recuperação de informações que, em última análise, tem a sua razão de ser centrada na satisfação das necessidades informacionais e documentais deste mesmo usuário.
Finalmente, o banco de termos pode ser oferecido como um novo produto do serviço de informações aos usuários. Profissionais ligados aos campos de atuação das linguagens naturais seriam especialmente beneficiados através desta iniciativa, bem como os usuários do sistema de documentos e informações, que teriam a disposição mecanismos de busca mais confiáveis, dinâmicos e abrangentes.
Implicações para o ambiente processador de informações
Os seguintes benefícios podem ser obtidos através da introdução de bancos de termos no ambiente processador de documentos e informações:
a. a criação de terminologia consistente para atender às necessidades de cientistas da informação e usuários;
b. o enriquecimento do idioma nacional, fazendo uso de seus processos lingüísticos dinâmicos e inerentes e a incorporação deste léxico recém-criado aos procedimentos de classificação empregados (Velho Lopes, 1989);
c. a padronização do vocabulário técnico, científico e terminológico, evitando ambigüidades na conceituação e definições (Velho Lopes, 1989).
Portanto, temos palavras e termos controlados atuando dentro de parâmetros flexíveis que são revisados, aumentados e modificados por cientistas da informação, lingüistas e usuários finais. Os usuários finais também são questionados para saber se estão satisfeitos com as palavras-chaves e de indexação utilizadas, se têm sugestões para expandi-las e contribuir com comentários para o crescimento do sistema de classificação e indexação. Compartilhar com o usuário a responsabilidade de implementar os mecanismos de classificação e indexação, constitui uma alternativa que não pode ser ignorada pelos cientistas da informação, caso estes visarem o projeto de sistemas em linha mais poderosos e precisos, principalmente para melhor satisfazer as necessidades informacionais e documentárias destes mesmos usuários.
4. Conclusão
Ferramentas automatizadas, tais como bancos de termos, podem ser extremamente valiosas para otimizar o acesso e a recuperação de material de cunho documentário e informativo, principalmente para aqueles provenientes de recém-criadas áreas de especialização. Os resultados imediatos, obtidos através da incorporação de bancos de termos ao ambiente processador de documentos e informações, constituem uma melhor descrição dos mesmos, sendo que esta descrição se aproxima da linguagem natural dos usuários, dentro de parâmetros flexíveis controlados pelo cientista da informação.
Referências
VELHO LOPES, Roseane. Analysis of multilingual information access and retrieval at CIENTEC - Fundação de Ciência e Tecnologia - Brazil. UMIST, MSc Dissertation, 1987.
VELHO LOPES, Roseane. "Automation to access multilingual information: a case study". Information Development, vol. 5, julho 1989.
VELHO LOPES, Roseane. "Normalização e Desenvolvimento". INMETRO/IBM Brasil, 1989. Monografia premiada com o 1° lugar no Primeiro Concurso Nacional de Monografias sobre Normalização.
|