|
Os desafios da tradução automatizada
Paltónio Daun Fraga
Universidade de São Paulo
Brasil
Resumo
Entre todos os desafios que a tradução nos oferece, salientamos o tecnológico, o científico e o econômico. A tradução automatizada associada às grandes bases de informação, que são acessíveis pelas redes de computadores, pode viabilizar uma maior divulgação do conhecimento tecnológico e científico, e propiciar uma transferência de tecnologias aos países desenvolvidos para os países em desenvolvimento.
Entre todos os desafios que a tradução nos oferece, salientamos o tecnológico , o científico e o econômico . A tradução automatizada, associada às grandes bases de informação que são acessíveis pelas redes de computadores, pode viabilizar uma maior divulgação do conhecimento tecnológico e científico, e propiciar uma transferência de tecnologias dos países desenvolvidos para os países em desenvolvimento.
A democratização da informática trará inevitavelmente a democratização da informação (aliás, a palavra Informatique foi criada na França para nomear a ciência da informação, cobrindo uma área carente da Computer Science americana). A informação técnico-científica, que nos é prioritária, tem sido gerada, nas últimas décadas, de uma forma acelerada nos países ricos, onde se processa, há algum tempo, a revolução pós-industrial, que é a revolução da informação tecnológica .
A nossa defasagem sócio-econômica pode agravar-se, se não houver uma democratização da informação nas universidades, nos centros tecnológicos e de pesquisa básica. Para tanto, deve-se informatizar adequadamente as bibliotecas e oferecer acesso às bases de dados nas várias áreas de ensino e pesquisa. Um grande volume dessas bases de informação tornou-se acessível pelas redes de computadores em inglês, francês, alemão, japonês e espanhol, com predominância da língua inglesa, devido à sua internacionalização, ao volume de investimentos e ao mercado consumidor. A tradução automatizada pode viabilizar essa divulgação.
Estações de trabalho de alto desempenho e capacidade estão sendo oferecidas a baixo custo, e vários sistemas de tradução ajudada por computadores já apareceram no mercado, alguns ainda imaturos, pois negligenciam as bases lingüística e terminológica necessárias. O desafio tecnológico consiste em tornar acessível a informação para um melhor desenvolvimento do profissional. Sistemas de tradução e de acesso a bases terminológicas especializados num domínio [1], com alto grau de confiabilidade, serão de grande utilidade a estudantes e profissionais.
Modelos formais lingüísticos e semânticos, tanto gerais da língua, quanto do jargão técnico, devem ser estudados, bem como devem ser formalizadas as gramáticas contrastivas e comparativas entre pares de línguas. Esse é o desafio científico mais interessante, por tentar formalizar, com ferramentas matemáticas e computacionais, uma das atividades mais aprimoradas do homem moderno, que é o uso da linguagem como meio de comunicação e de criação.
Esse também é um desafio sócio-econômico, pois uma sociedade alijada de alcançar plena liberdade de informação estará alijada da liberdade de escolha e, portanto, da democracia plena da qual decorre seu desenvolvimento econômico.
Do ponto de vista meramente econômico, poderíamos ressaltar que o custo da informação é hoje muito grande, e sua disseminação é lenta e bastante desigual. Há uma grande demanda de traduções e, com o aumento do seu consumo potencial, pode-se ter uma economia de escala, viabilizando projetos antes inexeqüíveis.
Com relação às supostas influências negativas e nefastas que poderiam ser impostas pela dominação tecnológica exógena, pensamos que sem esta informação a situação seria ainda pior, pois a dominação seria tanto de cunho cultural quanto econômico, não havendo competitividade. A captação dessa informação não seria prejudicial se sua utilização fosse devidamente avaliada e adequada às prioridades nacionais.
Pesquisas científicas de um corpus técnico podem fornecer as bases para o grande desafio intelectual na aquisição de conhecimento, sua "compreensão", manipulação e transposição para outra cultura, A linguagem de especialidade (literatura técnica especializada) tem merecido um estudo em seu léxico, nos levantamentos terminológicos, mas carece de um estudo sintático-semântico sistemático, inclusive com o apuramento da redação de relatórios técnicos. Dessa forma, tentar-se-ia reduzir as ambigüidades, em especial as ambigüidades estruturais, o que certamente facilitaria a compreensão humana e permitiria um tratamento formal mais seguro.
Por outro lado, o tratamento informático permitiria detectar dificuldades sintáticas e semânticas e, como preconiza Christian BOITET, poder-se-ia retornar ao autor os trechos problemáticos, via rede de computadores. Uma vez revisados pelo autor, os textos seriam realimentados e reintegrados na base de informações e, então, traduzidos para disseminação.
Hoje, é possível realizar uma análise estrutural do texto com grande refinamento, sendo mais difícil sua interpretação semântica, pois, nesse campo, existem poucas teorias gerais aplicáveis a todas as situações. Espera-se que, com a fixação do campo semântico, típico de uma linguagem de especialidade e com o auxílio de sistemas especialistas no mesmo domínio, seja possível um tratamento automático confiável da informação, para a transferência de conhecimentos entre diferentes culturas.
As pesquisas sobre as aplicações da lingüística (notadamente tradução automática e pedagogia das línguas) estão em pleno progresso. Existem atualmente [2] 60 Sistemas de Tradução Automatizada no mundo, sendo 30 deles no Japão. Na França, existem tradicionais centros de estudos para a tradução automática e, desde 1959, uma Association pour l'étude et le développement de la traductíon automatique et de la linguistique appliquée (ATAIA) [3]. COLING, um congresso bianual da Association of Computational Linguistics (ACL) [4], comporta um número crescente de projetos de TA. Na USP, foi criado recentemente um grupo de pesquisas em tradução, lexicologia e terminologia automatizadas e pretende-se negociar planos de cooperação com o grupo GETA-Grenoble, o grupo EUROTRA-Portugal, entre outros.
O Japão utiliza uma das táticas mais modernas de desenvolvimento tecnológico e científico: as indústrias e universidades associaram-se, criando grandes grupos de trabalho em torno de projetos de interesse comum, que irão propiciar uma nova arquitetura de computadores integrada com o software , no projeto de 5 a geração, com ênfase em sistemas de inteligência artificial em que a tradução automática é mais uma das ferramentas oferecidas ao usuário, ficando a critério de cada grupo econômico o marketing dos produtos obtidos (vide relatórios do ICOT). Não havendo segredos industriais entre eles, os produtos terão uma qualidade mais homogênea e, com estes elementos de base, será possível desenvolver aplicações que independem de uma marca. A concorrência ocorrerá apenas no marketing , nas aplicações e na manutenção, havendo uma economia de escala.
Após essa lição japonesa, as multinacionais estão se associando para acompanhar os avanços tecnológicos a custos competitivos, pois os que não mudarem de tática estarão fadados ao sucateamento de seu parque industrial. Também a comunidade européia criou um projeto de pesquisa e desenvolvimento de ampla envergadura que se chama ESPRIT . As universidades e centros de pesquisa não podem ficar à margem desse processo rápido de transformação da sociedade.
Conclusão: Os progressos tecnológicos em hardware (redes de estações de trabalho), em software (programação lógica, funcional, orientada para objetos, redes neurais), e em lingware (metalinguagens de descrição lingüística, automata gerais), bem como uma maior consciência da modelização e formalização da lingüística e das teorias de conhecimento, incluindo a semântica, a pragmática, a lógica, a filosofia, a epistemologia e a semiótica, possibilitam a construção de protótipos operacionais coerentes. As teorias sairão do papel para a prática.

[1] Zemgulis, Anne Marie e Maltoni, Mareia C.V.A. - A normalização terminológica e o desenvolvimento tecnológico - XXII Congresso Nacional de Informática, 1989.
 [2] Terminometro XII- n. 4, 1989.
 [3] Perrot, Jean - La linguistique - Presses Universitaires de France, Paris, 1969.

[4] COLING 80 - Proceeding of the 8th International Conference on Computational Linguistics, Tokyo, Sept-Oct 1980.
|