Uma análise dos anglicismos detectáveis
no léxico informático de Revistas da especialidade
entre os anos de 1980 a 1992
António Bárbolo Alves
Universidade do Minho
Projecto Minerva
Altamiro Barbosa Machado
Universidade do Minho
Departamento de Informática
Portugal
Resumo
A introdução de neologismos de Língua Inglesa tem sido uma constante nos últimos anos, sobretudo no domínio das linguagens técnicas, nomeadamente das relacionadas com as Tecnologias da Informação. Este artigo pretende avaliar a situação através de uma análise diacrónica de frequências de vocábulos técnicos anglicizantes em revistas técnicas de informática ao longo das últimas duas décadas.
Para efectuar esta análise de frequências foi utilizado um programa de análise denominado Stablex e uma Folha de Cálculo (Excel).
Como grandes conclusões deste estudo ressaltam o carácter temporário de alguns termos e o facto de a profusão de termos utilizados não ser tão grande como normalmente se crê.
Objectivos
Num artigo recentemente publicado na Revista Portuguesa de Educação, o professor Amadeu Torres afirmava: «Uma língua de civilização (...) tem de acompanhar as conquistas do progresso. Isso só será possível mediante uma constante actualização terminológica, a qual deve processar-se segundo as matrizes idiomáticas e das aquisições lexicais externas. Embora aquelas gozem de primazia, em muitos casos torna-se necessário o recurso xenotrófico» (Torres, 1990:19). E, mais recentemente ainda, o mesmo autor reconhece ser um facto inconstestável a «necessidade do recurso xenotrófico, quer através do empréstimo e da neologização quer da cunhagem terminológica» (Torres, 1993:170). Todavia, o ritmo do progresso da sociedade actual, caracterizado pela constante mudança e pela aquisição de novos conhecimentos e conceitos, de novos valores culturais, sociais e outros, parece não se compadecer com a necessidade de reflexão tão do agardo de linguistas e filólogos.
A necessidade, por parte das línguas naturais, de acompanhar este processo de mudança implica a criação de novas palavras para designar essas novas realidades extra-linguísticas. A Informática ou, em sentido mais lato, a Tecnologias da Informação (T.I.), mais do que qualquer outra área do conhecimento, conhecem actualmente e conhecerão num futuro próximo, um prodigioso desenvolvimento, contribuindo assim para a criação de novas realidades e consequente enriquecimento do léxico. Este estado de coisas, tão ou mais importante para a difusão das diferentes línguas como a invenção da escrita, marca uma nova era no progresso tecnológico. Mas também, neste domínio, os novos termos, geralmente de origem anglo-saxónica, mal são adaptados, vêem-se logo substituídos por outros ainda mais novos; daí que haja necessidade de, por exemplo, repensar os critérios e as formas de elaboração dos dicionários, de modo a tornar mais fácil a sua actualização. Diriamos que, se nos lembrarmos por exemplo da palavra ordenador, utilizada na Língua Portuguesa, no início da década de oitenta, como sinónimo de computador, e ainda agora registada em alguns dicionários como tal, que o significado de aquele que ordena, nos leva a pensar ser função do computador, ordenar, não no sentido de pôr em ordem, de dispor, mas, se tivermos em conta que ele passa por cima das palavras que o dicionário permite e obriga a usar outras cada vez mais novas e inexistentes nesse dicionário, somos levados a pensar que ele realmente ordena no sentido de mandar, de pôr em ordem ou na ordem. Quem manda é, afinal, não o dicionário que dita as palavras que podem ser usadas, mas o ordenador, que exige o uso de outras que o dicionário irá, mais cedo ou mais tade, ser obrigado a aceitar, sob pena de se tornar obsoleto e inútil.
Este artigo parte do pressuposto que as Revistas de Informática são, por excelência, um espaço de aplicação e utilização do novo vocabulário especialmente relacionado com as T.I. Assim sendo, parece-nos que o estudo do vocabulário aí utilizado poderá fornecer um ponto de partida vasto e sólido para o estudo do processo de integração de novas palavras no léxico da Língua Portuguesa. Trata-se, em nosso em nosso entender, de um espaço privilegiado de entrada, cultivo, disseminação e validação deste vocabulário que, primeiro timidamente em itálico, ou «entre aspas», depressa deixam esse «estado larvar» (Torres: 1990) para ganhar «direitos de cidadania» mesmo sem nunca ter pertencido às matrizes idiomáticas da Língua Portuguesa. Lembremos, por exemplo, o que aconteceu com palavras como software e computador: O que é feito do ordenador e do suporte lógico que muitos dicionários, mesmo de termos informáticos, fornecem ou propõem como sinónimos (Cf., por exemplo, Mateus, 1992). Por outro lado, há palavras que, embora já existentes no idioma, ganharam novos valores semânticos com as T.I.: rato, memória, disco, formato, janela, botão, são apenas alguns exemplos. Paralelamente a estes dois fenómenos, há novas palavras, criadas segundo as matrizes idiomáticas e amplamente utilizadas mesmo em detrimento das originais inglesas: estamos a lembrar-nos por exemplo, de «placa-mãe», que parece querer quebrar a ligação umbilical à mother-board inglesa.
Assim, uma vez feito o levantamento desse léxico, são objectivos deste artigo:
1. Identificar esse novo léxico;
2. Situar, no tempo e no espaço, (leia-se publicação) a entrada do léxico e a sua utilização frequente ou banalização do uso;
3. Determinar a sua frequência.
Para a consecução destes objectivos seleccionámos algumas revistas cuja tema é a Informática e retiramos todos os textos que constituirão o nosso corpus. Procedemos depois ao seu tratamento, agrupando os diferentes textos por anos de publicação, fazendo o levantamento do vocabulário exclusivo e do vocabulário comum a cada grupo.
Selecção de textos
Não foi fácil encontrar reevistas que tivesem sido publicadas durante um razoável período de tempo (dez anos, aproximadamente), pois verifica-se que a grande maioria apenas sobrevive dois ou três anos. Após a consulta dos ficheiros da Biblioteca Pública da Universidade do Minho referentes às revistas da especialidade seleccionámos as seguintes:
|
SOFTWARE |
RS232 |
REVISTA DE INFORMÁTICA |
PERSONAL COMPUTER WOLRD |
|
Ano 1
Nº 1
Julho 1984 |
Ano 1
Nº 1
Janeiro 1988 |
Vol. 1
Nº 1
Jan./Mar. 1980 |
Nº1
Vol. 1
Jan. 1987 |
|
Ano 4
Nº 23
Nov./Dez. 1988 |
Ano 3
Nº 30
Novembro 90 |
Vol. 5
Nº 6
Nov./Dez. 1984 |
Nº 37
Vol. 4
Janeiro 1990 |
|
Nº 32
Dez./Jan. 90-91 |
Nº 38
Setembro 1991 |
Vol. 6
Nº 10
Nov./Dez. 1988 |
Nº 65
Vol. 6
Maio 1992 |
|
3 Revistas |
3 Revistas |
3 Revistas |
3 Revistas |
Introdução e tratamento dos dados
Os textos destas Revistas foram todos introduzidos no computador, através de um processo de digitalização, sendo posteriomente recuperados num Processador de Texto para a correcção dos erros de edição. Agrupá-mo-los depois por anos de publicação para localizar as entradas de novo vocabulário e para poderem ser tratados pelo Programa STABLEX.
Deste reagrupamento resultaram três novos documentos, e que podemos designar por Grupo UM, Grupo DOIS e Grupo TRÊS compreendendo os seguintes textos:
|
Grupo UM
(Três Revistas) |
Grupo DOIS
(Três Revistas) |
Grupo TRÊS
(Quatro Revistas) |
| R. Informática (1980)
Software (1984)
R. Informática (1984) |
PCWorld (1987)
RS232 (1988)
Software (1988)
R. Informática (1988) |
PCWorld (1990)
PCWorld (1992)
RS232 (1991)
Software (1991) |
Dispomos assim de um primeiro grupo com textos de 1980 a 1984, o segundo de 1987 a 1988 e o terceiro de 1990 a 1992.
Apresenta-se, de seguida, uma amostra do vocabulário do primeiro grupo de Revistas, depois de tratado pelo programa STABLEX e recuperado numa Folha de Cálculo. Na primeira coluna figuram as palavras, ordenadas alfabeticamente, na segunda coluna o Total das Ocorrências e, nas colunas seguintes, a distribuição pelas revistas. T1 corresponde à Revista de Informática, nº 1, vol. 1, de Jan./Mar. de1980, T2 à mesma revista, nº 6, vol. 5, de Nov./Dez. de 1984 e T3 à revista Software, ano 1, nº1, de Julho de 1984.
Tabela nº 1
|
Vocabulário |
TOTAL |
T1 |
T2 |
T3 |
| a |
1315 |
481 |
571 |
263 |
| à |
145 |
45 |
75 |
25 |
| a-priori |
1 |
0 |
1 |
0 |
| ab |
23 |
0 |
0 |
23 |
| abaco |
1 |
0 |
1 |
0 |
| abarcar |
1 |
0 |
1 |
0 |
| abcissa |
2 |
0 |
0 |
2 |
| abcissas |
3 |
0 |
0 |
3 |
| aberta |
3 |
1 |
2 |
0 |
| abertas |
1 |
0 |
1 |
0 |
| aberto |
1 |
1 |
0 |
0 |
| abertura |
2 |
0 |
2 |
0 |
Procedemos de igual modo para os restantes textos e revistas agrupados, como acima se disse, pela proximidade de ano de publicação. O resultado, em termos de contabilidade de efectivos lexicais pelos diferentes grupos, é o seguinte:
|
Grupo UM |
Grupo DOIS |
Grupo TRÊS |
|
R. Informática (1980)
14026 Ocorrências |
PCWorld (1987)
19736 Ocorrências |
PCWorld (1990)
20904 Ocorrências |
|
Software (1984)
14239 Ocorrências |
RS232 (1988)
4674 Ocorrências |
PCWorld (1992)
8548 Ocorrências |
|
R. Informática (1984)
6703 Ocorrências |
Software (1988)
15873 Ocorrências |
RS232 (1991)
10760 Ocorrências |
| |
R. Informática (1988)
7830 Ocorrências |
Software (1991)
7232 Ocorrências |
|
TOTAL: 34 968 |
48 113 |
47 444 |
| TOTAL DOS TRÊS GRUPOS |
130 525 Ocorrências |
Esta primeira análise feita pelo Stablex forneceu-nos também a diversidade lexical, ou seja, o número de palavras diferentes que compõem o léxico de cada grupo, e que é o seguinte:
|
Grupo UM |
Grupo DOIS |
Grupo TRÊS |
|
5872 Palavras (diferentes) |
6793 Palavras (diferentes) |
7487 Palavras (diferentes) |
Compactação e fusão dos textos
Numa segunda fase procedemos à compactação de cada um dos grupos, ou seja, a redução das três ou quatro colunas que o constituem a uma só. Todavia a informação obtida nesta primeira análise continua disponível, tal como os textos que serviram de ponto de partida à análise feita. Podemos pois voltar a eles sempre que quisermos ou necessitarmos.
Da compactação e posterior fusão dos três grupos resulta uma tabela cujas primeiras linhas se mostram de seguida e onde:
Na primeira coluna figuram os vocábulos ordenados por ordem alfabética;
Na segunda coluna o total dos efectivos;
Na terceira coluna encontramos o resultado da compactação do primeiro grupo de revistas (anos de 1980 a 1984);
Na quarta coluna os vocábulos resultantes da compactação das revistas de 1987 a 1988;
Na quinta e última coluna figura o total dos vocábulos das revistas de 1990 a 1992.
Tabela nº 2
| Vocabulário |
TOTAL |
T1 |
T2 |
T3 |
| |
|
(80/84) |
(87/88) |
(90/92) |
| a |
4927 |
1315 |
1758 |
1854 |
| à |
442 |
145 |
168 |
129 |
| a0 |
2 |
0 |
2 |
0 |
| a1 |
1 |
0 |
1 |
0 |
| a4 |
4 |
0 |
0 |
4 |
| a5 |
1 |
0 |
0 |
1 |
| a-priori |
2 |
1 |
1 |
0 |
| ab |
23 |
23 |
0 |
0 |
| abaco |
1 |
1 |
0 |
0 |
| abaixo |
5 |
0 |
2 |
3 |
Vejamos também as primeiras linhas deste léxico, por ordem decrescente:
Tabela nº 3
| Vocabulário |
TOTAL |
T1 |
T2 |
T3 |
| de |
8162 |
2107 |
2868 |
3187 |
| a |
4927 |
1315 |
1758 |
1854 |
| o |
3837 |
886 |
1622 |
1329 |
| e |
3612 |
1160 |
1269 |
1183 |
| que |
2665 |
699 |
1030 |
936 |
| do |
1907 |
447 |
742 |
718 |
| um |
1712 |
438 |
628 |
646 |
| em |
1705 |
458 |
571 |
676 |
| da |
1680 |
542 |
602 |
536 |
| para |
1663 |
381 |
654 |
628 |
| uma |
1366 |
333 |
508 |
525 |
| os |
1296 |
334 |
493 |
469 |
| é |
1270 |
318 |
522 |
430 |
| com |
1149 |
214 |
465 |
470 |
| as |
1036 |
336 |
397 |
303 |
| no |
1028 |
273 |
377 |
378 |
Como se pode verificar, os primeiros vocábulos correspondem sobretudo a palavras gramaticais.
Vejamos agora, a título exemplificativo, quais os lexemas mais frequentes, que, como se pode verificar, têm ocorrências bem mais reduzidas:
Tabela nº 4
| Vocabulário |
TOTAL |
T1 |
T2 |
T3 |
| sistemas |
293 |
55 |
147 |
91 |
| mas |
290 |
68 |
115 |
107 |
| informação |
277 |
123 |
78 |
76 |
| programa |
268 |
70 |
137 |
61 |
| esta |
259 |
75 |
68 |
116 |
| nos |
256 |
72 |
82 |
102 |
| foi |
252 |
84 |
66 |
102 |
| entre |
241 |
78 |
84 |
79 |
| sua |
238 |
74 |
63 |
101 |
| também |
222 |
35 |
90 |
97 |
| informática |
218 |
165 |
30 |
23 |
| seu |
212 |
67 |
61 |
84 |
| aplicações |
209 |
30 |
110 |
69 |
| tem |
209 |
62 |
80 |
67 |
| cada |
208 |
80 |
75 |
53 |
| ibm |
205 |
6 |
90 |
109 |
| pelo |
205 |
55 |
63 |
87 |
| muito |
202 |
42 |
70 |
90 |
| desenvolvimento |
200 |
79 |
63 |
58 |
| pela |
198 |
52 |
71 |
75 |
| software |
198 |
24 |
59 |
115 |
| ainda |
195 |
53 |
74 |
68 |
| número |
194 |
93 |
53 |
48 |
| qualquer |
191 |
42 |
60 |
89 |
| já |
189 |
45 |
80 |
64 |
| memória |
185 |
12 |
69 |
104 |
| sobre |
171 |
70 |
57 |
44 |
| aos |
168 |
48 |
68 |
52 |
| base |
167 |
35 |
98 |
34 |
| podem |
166 |
27 |
81 |
58 |
| está |
165 |
48 |
57 |
60 |
| modo |
165 |
18 |
85 |
62 |
| num |
165 |
40 |
53 |
72 |
| quando |
162 |
29 |
49 |
84 |
| computadores |
161 |
31 |
59 |
71 |
| tempo |
161 |
35 |
38 |
88 |
| computador |
158 |
28 |
38 |
92 |
| mesmo |
158 |
40 |
53 |
65 |
| assim |
157 |
37 |
71 |
49 |
| permite |
157 |
30 |
80 |
47 |
| vez |
147 |
24 |
71 |
52 |
| utilizadores |
145 |
17 |
85 |
43 |
| apenas |
143 |
22 |
55 |
|