Actas / Atas
1988-2002
Presentación / Apresentação
I Simposio (1988)
II Simpósio (1990)
III Simposio (1992)
IV Simposio (1994)
    Índice
V Simposio (1996)
VI Simposio (1998)
VII Simpósio (2000)
VIII Simpósio (2002)
Índice por autores

 

 

Uma análise dos anglicismos detectáveis
no léxico informático de Revistas da especialidade
entre os anos de 1980 a 1992

António Bárbolo Alves
Universidade do Minho
Projecto Minerva

Altamiro Barbosa Machado
Universidade do Minho
Departamento de Informática
Portugal

 

Resumo

A introdução de neologismos de Língua Inglesa tem sido uma constante nos últimos anos, sobretudo no domínio das linguagens técnicas, nomeadamente das relacionadas com as Tecnologias da Informação. Este artigo pretende avaliar a situação através de uma análise diacrónica de frequências de vocábulos técnicos anglicizantes em revistas técnicas de informática ao longo das últimas duas décadas.

Para efectuar esta análise de frequências foi utilizado um programa de análise denominado Stablex e uma Folha de Cálculo (Excel).

Como grandes conclusões deste estudo ressaltam o carácter temporário de alguns termos e o facto de a profusão de termos utilizados não ser tão grande como normalmente se crê.

 

Objectivos

Num artigo recentemente publicado na Revista Portuguesa de Educação, o professor Amadeu Torres afirmava: «Uma língua de civilização (...) tem de acompanhar as conquistas do progresso. Isso só será possível mediante uma constante actualização terminológica, a qual deve processar-se segundo as matrizes idiomáticas e das aquisições lexicais externas. Embora aquelas gozem de primazia, em muitos casos torna-se necessário o recurso xenotrófico» (Torres, 1990:19). E, mais recentemente ainda, o mesmo autor reconhece ser um facto inconstestável a «necessidade do recurso xenotrófico, quer através do empréstimo e da neologização quer da cunhagem terminológica» (Torres, 1993:170). Todavia, o ritmo do progresso da sociedade actual, caracterizado pela constante mudança e pela aquisição de novos conhecimentos e conceitos, de novos valores culturais, sociais e outros, parece não se compadecer com a necessidade de reflexão tão do agardo de linguistas e filólogos.

A necessidade, por parte das línguas naturais, de acompanhar este processo de mudança implica a criação de novas palavras para designar essas novas realidades extra-linguísticas. A Informática ou, em sentido mais lato, a Tecnologias da Informação (T.I.), mais do que qualquer outra área do conhecimento, conhecem actualmente e conhecerão num futuro próximo, um prodigioso desenvolvimento, contribuindo assim para a criação de novas realidades e consequente enriquecimento do léxico. Este estado de coisas, tão ou mais importante para a difusão das diferentes línguas como a invenção da escrita, marca uma nova era no progresso tecnológico. Mas também, neste domínio, os novos termos, geralmente de origem anglo-saxónica, mal são adaptados, vêem-se logo substituídos por outros ainda mais novos; daí que haja necessidade de, por exemplo, repensar os critérios e as formas de elaboração dos dicionários, de modo a tornar mais fácil a sua actualização. Diriamos que, se nos lembrarmos por exemplo da palavra ordenador, utilizada na Língua Portuguesa, no início da década de oitenta, como sinónimo de computador, e ainda agora registada em alguns dicionários como tal, que o significado de aquele que ordena, nos leva a pensar ser função do computador, ordenar, não no sentido de pôr em ordem, de dispor, mas, se tivermos em conta que ele passa por cima das palavras que o dicionário permite e obriga a usar outras cada vez mais novas e inexistentes nesse dicionário, somos levados a pensar que ele realmente ordena no sentido de mandar, de pôr em ordem ou na ordem. Quem manda é, afinal, não o dicionário que dita as palavras que podem ser usadas, mas o ordenador, que exige o uso de outras que o dicionário irá, mais cedo ou mais tade, ser obrigado a aceitar, sob pena de se tornar obsoleto e inútil.

Este artigo parte do pressuposto que as Revistas de Informática são, por excelência, um espaço de aplicação e utilização do novo vocabulário especialmente relacionado com as T.I. Assim sendo, parece-nos que o estudo do vocabulário aí utilizado poderá fornecer um ponto de partida vasto e sólido para o estudo do processo de integração de novas palavras no léxico da Língua Portuguesa. Trata-se, em nosso em nosso entender, de um espaço privilegiado de entrada, cultivo, disseminação e validação deste vocabulário que, primeiro timidamente em itálico, ou «entre aspas», depressa deixam esse «estado larvar» (Torres: 1990) para ganhar «direitos de cidadania» mesmo sem nunca ter pertencido às matrizes idiomáticas da Língua Portuguesa. Lembremos, por exemplo, o que aconteceu com palavras como software e computador: O que é feito do ordenador e do suporte lógico que muitos dicionários, mesmo de termos informáticos, fornecem ou propõem como sinónimos (Cf., por exemplo, Mateus, 1992). Por outro lado, há palavras que, embora já existentes no idioma, ganharam novos valores semânticos com as T.I.: rato, memória, disco, formato, janela, botão, são apenas alguns exemplos. Paralelamente a estes dois fenómenos, há novas palavras, criadas segundo as matrizes idiomáticas e amplamente utilizadas mesmo em detrimento das originais inglesas: estamos a lembrar-nos por exemplo, de «placa-mãe», que parece querer quebrar a ligação umbilical à mother-board inglesa.

Assim, uma vez feito o levantamento desse léxico, são objectivos deste artigo:

1. Identificar esse novo léxico;

2. Situar, no tempo e no espaço, (leia-se publicação) a entrada do léxico e a sua utilização frequente ou banalização do uso;

3. Determinar a sua frequência.

Para a consecução destes objectivos seleccionámos algumas revistas cuja tema é a Informática e retiramos todos os textos que constituirão o nosso corpus. Procedemos depois ao seu tratamento, agrupando os diferentes textos por anos de publicação, fazendo o levantamento do vocabulário exclusivo e do vocabulário comum a cada grupo.

 

Selecção de textos

Não foi fácil encontrar reevistas que tivesem sido publicadas durante um razoável período de tempo (dez anos, aproximadamente), pois verifica-se que a grande maioria apenas sobrevive dois ou três anos. Após a consulta dos ficheiros da Biblioteca Pública da Universidade do Minho referentes às revistas da especialidade seleccionámos as seguintes:

SOFTWARE

RS232

REVISTA DE INFORMÁTICA

PERSONAL COMPUTER WOLRD

Ano 1
Nº 1
Julho 1984

Ano 1
Nº 1
Janeiro 1988

Vol. 1
Nº 1
Jan./Mar. 1980

Nº1
Vol. 1
Jan. 1987

Ano 4
Nº 23
Nov./Dez. 1988

Ano 3
Nº 30
Novembro 90

Vol. 5
Nº 6
Nov./Dez. 1984

Nº 37
Vol. 4
Janeiro 1990

Nº 32
Dez./Jan. 90-91

Nº 38
Setembro 1991

Vol. 6
Nº 10
Nov./Dez. 1988

Nº 65
Vol. 6
Maio 1992

3 Revistas

3 Revistas

3 Revistas

3 Revistas

 

Introdução e tratamento dos dados

Os textos destas Revistas foram todos introduzidos no computador, através de um processo de digitalização, sendo posteriomente recuperados num Processador de Texto para a correcção dos erros de edição. Agrupá-mo-los depois por anos de publicação para localizar as entradas de novo vocabulário e para poderem ser tratados pelo Programa STABLEX.

Deste reagrupamento resultaram três novos documentos, e que podemos designar por Grupo UM, Grupo DOIS e Grupo TRÊS compreendendo os seguintes textos:

Grupo UM

(Três Revistas)

Grupo DOIS

(Três Revistas)

Grupo TRÊS

(Quatro Revistas)

R. Informática (1980)

Software (1984)

R. Informática (1984)

PCWorld (1987)

RS232 (1988)

Software (1988)

R. Informática (1988)

PCWorld (1990)

PCWorld (1992)

RS232 (1991)

Software (1991)

Dispomos assim de um primeiro grupo com textos de 1980 a 1984, o segundo de 1987 a 1988 e o terceiro de 1990 a 1992.

Apresenta-se, de seguida, uma amostra do vocabulário do primeiro grupo de Revistas, depois de tratado pelo programa STABLEX e recuperado numa Folha de Cálculo. Na primeira coluna figuram as palavras, ordenadas alfabeticamente, na segunda coluna o Total das Ocorrências e, nas colunas seguintes, a distribuição pelas revistas. T1 corresponde à Revista de Informática, nº 1, vol. 1, de Jan./Mar. de1980, T2 à mesma revista, nº 6, vol. 5, de Nov./Dez. de 1984 e T3 à revista Software, ano 1, nº1, de Julho de 1984.

Tabela nº 1

Vocabulário

TOTAL

T1

T2

T3

a

1315

481

571

263

à

145

45

75

25

a-priori

1

0

1

0

ab

23

0

0

23

abaco

1

0

1

0

abarcar

1

0

1

0

abcissa

2

0

0

2

abcissas

3

0

0

3

aberta

3

1

2

0

abertas

1

0

1

0

aberto

1

1

0

0

abertura

2

0

2

0

Procedemos de igual modo para os restantes textos e revistas agrupados, como acima se disse, pela proximidade de ano de publicação. O resultado, em termos de contabilidade de efectivos lexicais pelos diferentes grupos, é o seguinte:

Grupo UM

Grupo DOIS

Grupo TRÊS

R. Informática (1980)

14026 Ocorrências

PCWorld (1987)

19736 Ocorrências

PCWorld (1990)

20904 Ocorrências

Software (1984)

14239 Ocorrências

RS232 (1988)

4674 Ocorrências

PCWorld (1992)

8548 Ocorrências

R. Informática (1984)

6703 Ocorrências

Software (1988)

15873 Ocorrências

RS232 (1991)

10760 Ocorrências

 

R. Informática (1988)

7830 Ocorrências

Software (1991)

7232 Ocorrências

TOTAL: 34 968

48 113

47 444

TOTAL DOS TRÊS GRUPOS 130 525 Ocorrências

Esta primeira análise feita pelo Stablex forneceu-nos também a diversidade lexical, ou seja, o número de palavras diferentes que compõem o léxico de cada grupo, e que é o seguinte:

Grupo UM

Grupo DOIS

Grupo TRÊS

5872 Palavras (diferentes)

6793 Palavras (diferentes)

7487 Palavras (diferentes)

 

Compactação e fusão dos textos

Numa segunda fase procedemos à compactação de cada um dos grupos, ou seja, a redução das três ou quatro colunas que o constituem a uma só. Todavia a informação obtida nesta primeira análise continua disponível, tal como os textos que serviram de ponto de partida à análise feita. Podemos pois voltar a eles sempre que quisermos ou necessitarmos.

Da compactação e posterior fusão dos três grupos resulta uma tabela cujas primeiras linhas se mostram de seguida e onde:

Na primeira coluna figuram os vocábulos ordenados por ordem alfabética;

Na segunda coluna o total dos efectivos;

Na terceira coluna encontramos o resultado da compactação do primeiro grupo de revistas (anos de 1980 a 1984);

Na quarta coluna os vocábulos resultantes da compactação das revistas de 1987 a 1988;

Na quinta e última coluna figura o total dos vocábulos das revistas de 1990 a 1992.

 

Tabela nº 2

Vocabulário

TOTAL

T1

T2

T3

   

(80/84)

(87/88)

(90/92)

a

4927

1315

1758

1854

à

442

145

168

129

a0

2

0

2

0

a1

1

0

1

0

a4

4

0

0

4

a5

1

0

0

1

a-priori

2

1

1

0

ab

23

23

0

0

abaco

1

1

0

0

abaixo

5

0

2

3

Vejamos também as primeiras linhas deste léxico, por ordem decrescente:

Tabela nº 3

Vocabulário

TOTAL

T1

T2

T3

de

8162

2107

2868

3187

a

4927

1315

1758

1854

o

3837

886

1622

1329

e

3612

1160

1269

1183

que

2665

699

1030

936

do

1907

447

742

718

um

1712

438

628

646

em

1705

458

571

676

da

1680

542

602

536

para

1663

381

654

628

uma

1366

333

508

525

os

1296

334

493

469

é

1270

318

522

430

com

1149

214

465

470

as

1036

336

397

303

no

1028

273

377

378

Como se pode verificar, os primeiros vocábulos correspondem sobretudo a palavras gramaticais.

Vejamos agora, a título exemplificativo, quais os lexemas mais frequentes, que, como se pode verificar, têm ocorrências bem mais reduzidas:

Tabela nº 4

Vocabulário

TOTAL

T1

T2

T3

sistemas

293

55

147

91

mas

290

68

115

107

informação

277

123

78

76

programa

268

70

137

61

esta

259

75

68

116

nos

256

72

82

102

foi

252

84

66

102

entre

241

78

84

79

sua

238

74

63

101

também

222

35

90

97

informática

218

165

30

23

seu

212

67

61

84

aplicações

209

30

110

69

tem

209

62

80

67

cada

208

80

75

53

ibm

205

6

90

109

pelo

205

55

63

87

muito

202

42

70

90

desenvolvimento

200

79

63

58

pela

198

52

71

75

software

198

24

59

115

ainda

195

53

74

68

número

194

93

53

48

qualquer

191

42

60

89

189

45

80

64

memória

185

12

69

104

sobre

171

70

57

44

aos

168

48

68

52

base

167

35

98

34

podem

166

27

81

58

está

165

48

57

60

modo

165

18

85

62

num

165

40

53

72

quando

162

29

49

84

computadores

161

31

59

71

tempo

161

35

38

88

computador

158

28

38

92

mesmo

158

40

53

65

assim

157

37

71

49

permite

157

30

80

47

vez

147

24

71

52

utilizadores

145

17

85

43

apenas

143

22

55