|
Documentación automática para el estudio
del léxico jurídico italiano
desde la más antigua tradición escrita a nuestros días
Antonio Cammelli
Istituto per la Documentazione Giuridica del Cnr
Resumen
Las investigaciones sobre el léxico de una lengua pueden, hoy, disfrutar la contribución de los modernos sistemas documentarios. La lengua jurídica, en su desarrollo histórico, puede aprovechar esta oportunidad. La lengua jurídica italiana y, en general, las de tradición latina aprovecha nuevas oportunidades científicas dado que se están construyendo nuevos archivos electrónicos que documentan la historia, la evolución de la lengua jurídica que ha acompañado, como expresión del derecho, la misma historia de nuestras comunidades. Los modernos recursos informáticos pueden desarrollar muchos archivos que podemos definir callados puesto que faltan de aparatos eficientes de recobro de información. Lor archivos históricos, que usualmente tienen los documentos en su texto integral, son testimonios preciosos sea para el jurista informático sea para el histórico del derecho que comienza su busqueda de la palabra con la posibilidad, preciosa, de poder pasar de la palabra a los contextos correspondientes.
En esta ponencia se hace un primer balance de una investigación, todavía en marcha e que será oficilmente presentada en ocasión del Congreso internacional que nuestro Instituto celebrará en los primeros días de diciembre (se vea al propósito las páginas web a la siguiente dirección www.idg.fi.cnr.it/convegno98/annuncio.htm). En esta ocasión se publicará el primer CD perteneciente a la praxis, los otros que se refieren a la legislación y a la doctrina están previstos en los próximos dos años. La investigación ha sido la de poner en línea, es decir, a disposición de todos los estudiosos, un inmenso archivo de nuestro Instituto llamado VGI (Vocabolario Giuridico Italiano) que comprendía casi un millón de fichas de papel y que ahora estamos poniendo en línea con el presupuesto de pasar de un archivo compuesto por fichas de papel a un sistema documentario. Se trata de un corpus amplio que documenta la historia de la lengua jurídica en su desarrollo histórico casi paralelo a la evolución del idioma natural.
El proyecto VGI es el de ofrecer, mediante las grandes redes telemáticas un patrimonio cultural construido en muchos años y que, a nuestro parecer, constituye una preciosa fuente informativa para el jurista moderno.
1. El proyecto VGI: el archivo
Los archivos actuales de léxico jurídico de la lengua italiana han empezado a implementarse a partir de 1965 cuando la "Accademia della Crusca" ha empezado, en el mismo año sus trabajos oficiales para el Vocabulario de la lengua italiana. En esta obra general fue dato particulr relieve a la parte jurídica como parte siñificativa y original del diccionario general de la lengua italiana. Los archivos jurídicos se fundaron sobre el escrutinio electrónico de textos (textos integrales) y, también sobre escrutinios selectivos de otros textos. El presupuesto era y es el mismo de la Academia, es decir la fiel registración de la lengua como es o como ha sido en el pasado, teniendo en cuenta que el léxico del derecho a menudo se entrecruza con el léxico "común" puesto que unas palabras de uso corriente (casa, terreno por ejemplo) se hacen jurídicas sólo en contextos jurídicos.
Los textos que forman el corpus del archivo VGI sono 110 y han dado casi tres millones de palabras. Respecto al Vocabulario de la lengua italiana, cuyos escrutinios han llegado a 1375, el vocabulario jurídico de la lengua italiana comprende hoy un repertorio lingüístico que va desde 1723 hasta 1973. Este repertorio incluye todos los códigos a partir de la unidad italiana (1861) todavía vigentes o abrogados, los más importantes códigos preunitarios (especialmente los códigos napoleónicos en versión italiana) todas las constituciones de finales del siglo XVIII, todos los estatutos regionales a los que se han agregado otros textos de leyes consideradas significativas.
Los textos del escrutinio integral ocupan en todo doce mil páginas, mientras tenemos casi un millón de páginas de unos dos mil textos de que se han sacado casi un millón de fichas de papel conteniendo, en reproducción xerográfica, los vocablos de interés jurídico escogidos mediante escrutinio selectivo y riproducidos con el aporte des contextos. Los textos de los escrutinios selectivos van de 960, año con que convencionalmente en Italia se empieza a registrar la tradición escrita en vulgar, hasta 1975, bien sabiendo que no es posible poner límites al desarrollo de una lengua y que estos límites sirven sólo para tratar de racionalizar y utilizar el corpus examinado.
Desde su comienzo los archivos VGI fueron utilizados para la redacción de las voces del diccionario, una obra que, por lástima, se ha quedado incompleta: el proyecto moderno, empezado hace tre años, es el de transformar los archivos en un moderno sistema documentario de manera que este caudal documentario pueda ser disfrutable por los estudiosos de la historia del derecho.
El archivo electrónico, es decir el de los escrutinios integrales, puede ser consultado en un disco y necesita una racionalización para que sea interrogable con suficiente facilidad. El archivo selectivo ahora se ha trasladado en varios cd-rom de manera que se ha puesto remedio a la posibilidad de deterioración ínsita en el manejo de fichas de papel. Estos varios disquetes que reperesentan hoy un archivo callado deben llegar a ser un moderno y eficiente banco de datos de rápida y asistida consultación.
2. El proyecto VGI: el sistema documentario
El primer trabajo frente a un archivo come el de VGI es reducir y organizar todo el material informativo sin perder las informaciones (manteniendo, para cada contexto, las señalaciones hechas durante el escrutinio) con el presupuesto de facilitar su puesta en línea y, después, la consultación y la búsqueda. En este cuadro ha sido necesario quitar la división del archivo selectivo VGI que, desde su constitución, estaba dividido por autores y por obras. En un archivo de esta dimensión el trabajo de salvamento se presentaba de no fácil solución; valutando con cuidado los posibles medios ofrecidos por la tecnología actual, hemos escogido, también con atenta valutación económica, el de reproducir todas las fichas con imágenes, evitando una posible y fatigosa obra de arreglo de las mismas fichas. Con un gasto modesto el que era un archivo "callado" compuesto por más de un millón de lemas ha vuelto un archivo de imágenes en formato digital.
Para una mejor comprensión digamos que hoy hemos pasado de una archivo de papel por medio de reproducción, mediante scanner, a toda una serie de CD que permiten, a priori, una mejor fruición de todo el corpus. Además hemos evitado el riesgo de deterioración con una operación que representa la primera, obligada, etapa en el camino de construcción de una moderna base de datos.
Utilizando un programa finalizado a la tipología del corpus, ha habido la lematización que ha permitido de unificar en un único gran archivo todos los archivos secundarios constituidos por los autores y los distintos textos escrutinados. Esta operación ha permitido también de verificar y mejorar, en muchos casos, el viejo trabajo de escrutinio de que hemos hablado antes. Durante el trabajo de lematización tenemos en imágenes las distintas fichas de los distintos autores, y la imagen reproduce la ficha con sus campos (autor, obra, año de publicación etc.). En este momento de unificación podemos por un lado averiguar la escogidas de lemas y formas en los contextos y si hay unos contextos iguales es posible escoger el mejor asociando a ese contexto todos los lemas escogidos. Como se puede notar se pueden aumentar los términos lexicales y, al mismo tiempo se puede ahorrar unos contextos. Se ha estimado que esta reducción de contextos iguales es, aproximadamente, de un cuarto de todo el archivo. La reproducción en imágenes tiene otras ventajas que es la de poder implementar con agregaciones, correcciones, revisiones en cada fase del procedimiento. Esta revisión de cada ficha se presenta como una ulterior posibilidad de corregir las faltas cometidas en el momento de redacción de las fichas, una obra que, dado el tamaño del corpus, era imposible hacer si el archivo seguía siendo de papel.
Ahora tenemos un lemario con un porcentaje de falta inferior al originario y seguramente enriquecido por sucesivas atribuciones; todo eso, por cierto, constituye la más amplia atestación del léxico jurídico italiano. En realidad, dada la notable proximidad entre la lengua jurídica y la lengua natural, un archivo, como el nuestro, puede, acaso, producir todavía unas ambegüedades que se podrían resolver sólo con la redacción de un vocabulario. De todas formas el archivo se presenta ya capaz de documentar exaustivamente la historia de la lengua jurídica italiana.
3. Una base de datos para la historia de la lengua jurídica italiana
La conclusión de la primera etapa lleva a la formulación de dos listas de lemas y de formas: el lema es el término jurídico formalizado (nombre masculino singular, verbo al infinitivo etc.) la forma es cómo el lema se manifiesta en el texto: para el lingüista y el jurista es importante confrontar los dos aspectos para ver las evoluciones, las modificaciones que, a menudo, no aparecen si nos limitamos sólo al lemario. El lexicógrafo tendrá una notable ventaja si pueda utilizar un sistema de recobro de información que le permita un acceso al sistema con distintas llaves, es decir por lemas, por formas, por autor, por página.
Esta compleja obra de puesta al día representa un trabajo "debido" a todos los que, en nuestro instituto empezaron, hace años, la construcción de este archivo finalizado a la redacción de un vocabulario histórico de la lengua jurídica. El proyecto actual, seguramente es menos ambicioso respecto al proyecto originario, pero, disfrutando los adelantos de la moderna ciencia documentaria, podrá ser muy útil a la comunidad científica.
En efecto el concepto de vocabulario en sentido tradicional, especialmente cuando tenemos archivos de grandísimo tamaño, puede ser, útilmente substituido por aparatos de consultación electrónica; en esta perspectiva es necesario agregar a la base de datos sistemas de guía a la búsqueda que permitan de sacar del archivo todas las informaciones pedidas de una manera satisfactoria. En nuestro archivo ese instrumento guía será un índice razonado que permitirá un vínculo con los términos del corpus bajo el punto de vista semántico y conceptual. Es verdad que el vocabulario tradicional, dando a las definiciones los ejemplos correspondientes, representa en este sector un medio de estudio incomparable; pero un índice que permita la navegación, como se dice, en el lemario o en el formario podrá afrecer al usuario la posibilidad de ir a los contextos de mayor interés donde será fácil llegar a los significados básicos. Un vocabulario tradicional ofrece definiciones con ejemplos, tantas definiciones varios ejemplos correspondientes; un índice informático seguramente ofrece, en primer lugar, menos porque el usuario tiene que buscar los contextos, pero este "menos" puede significar mayor ductilidad, mayor elasticidad, mayor posibilidad de confrontar datos al mismo tiempo. A todo eso se puede agregar el hecho de que un sistema documentario electrónico puede siempre ser corregido, puesto al día, implementado y eso, considerando la dinamicidad del lenguaje jurídico, representa una ventaja que es preciso destacar.
4. Desarrollos y perspectivas en el estudio de la terminología jurídica
Como ya hemos dicho, después de puesta en seguridad de todo el antiguo archivo, tenemos una masa de datos de notable dimensión. En estos casos es necesario meditar bien los adelantos y los tiempos programados para hacer del archivo VGI un sistema documentario eficiente y disponible a los pedidos de los estudiosos. La tecnología informática nos ofrece una notable ayuda pero el trabajo humano pide unos tiempos fijos dado que el momento de la estructuración del archivo es un momento importante que puede dar notable apoyo al éxito de la empresa.
Respectando la clásica articulación entre legislación, doctrina y praxis, la primera tarea se ha dirigido hacia la praxis para dar un ensayo suficiente y bastante exaustivo del archivo y para averiguar en concreto las escogidas hechas. Por esta razón el primer CD realizado será el de la praxis que tiene un corpus bastante menejable y presenta una lengua jurídica particular que tiene una gran riqueza lexical a lo largo de las distintas etapas históricas. La costrucción del archivo respectando la clásica división del derecho de origen romana obedece también a medidas de oportunidad, es decir ordenar el archivo con etapas prefijadas de ultimación del trabajo y al mismo tiempo respectar la unidad del corpus dado que la división obrada es la misma del derecho. Después de la praxis en 1999 será tratata la legislación que representa casi la mitad del corpus y dentro del final del siglo la doctrina que es la parte más dificil, pero de mayor interés para ver la evolución del derecho en general y la de la lengua jurídica en particular. Dentro de unos días podremos afirmar que el archivo VGI será un sistema documentario: esta ponencia tiene, entre otros, este preciso presupuesto que es el de comunicar, en una conferencia prestigiosa como ésta, a la comunidad científica interesada a la lengua del derecho que en nuestro Instituto entre muchas bases de datos jurídicos hay una, acaso la mayor como consistencia, que atestigúa la evolución de la lengua jurídica italiana, en la convicción que el derecho del futuro será siempre la continuidad ideal y sustancial con el derecho del pasado.
El archivo VGI ahora en línea está disponible para el histórico del derecho, en primer lugar, y todos los que tienen la necesidad de documentar la evolución social con la evolución del derecho escrito. Esta ponencia tiene el presupuesto de buscar sugerencias y críticas por parte de los expertos de la documentación jurídica que tienen la oportunidad de experimentar técnicas y metodologías con un archivo de gran dimensión y que puede ser un test importante para la averiguación de cualquier sistema documentario. La etapa sucesiva prevee que, a margen de la realización del archivo documentario, se pueda agregar un índice lexical hipertextual finalizado esencialmente al estudio del lenguaje jurídico. Este índice, organizado según palabras llave se fundará sobre categorias semánticas (sinonimía, superioridad, inferioridad) de manera que al término principal se agregarán todos los términos vinculados; a su vez todos los términos relacionados constituirán un conjunto que, por si mismo, es, por un lado la síntesis crítica del contenido del corpus y por otro ofrece al lexicógrafo los indicatores precisos para el estudio del lenguaje jurídico, de su evolución, de su historia, de su relación con la lengua común.
Este índice lexical, una especie de thesaurus del archivo, es un instrumento de trabajo que tiene su validez además del corpus de referencia y constituye un medio de trabajo para los juristas, en particular, para que con la experiencia puedan mejorar, por ejemplo, la producción legislativa, también bajo el punto de vista terminológico de manera que los usuarios, en este caso, la comunidad civil, que es la destinataria privilegiada de cada texto normativo, pueda comprender bien el texto, con la convicción que una mejor comprensión textual lleva a una mejor aplicación concreta del mismo texto.Se trata de una etapa obligada hacia el presupuesto, más veces afirmado, de la certeza del derecho.
Sin embargo en esta investigación hay otros propósitos que aquí merece subrayar, aunque de una manera muy sintetica. El más importante es que un serio estudio terminológico de la lengua jurídica en sus procesos históricos puede ser útil para una moderna redacción normativa que sea capaz de producir textos claros teniendo en cuenta, o mas bien privilegiando a sus usuarios "olvidados", el ciudadano común y la comunidad social, que son los destinatarios naturales de cualquier texto normativo. Un estudio sobre los términos del derecho es precioso para una mejor redacción normativa que es una necesidad comun especialmente para los países que se rehacen a la tradición latina.
En efecto en el universo del derecho actúan dos mundos distintos: por un lado, el de los derechos reconocidos, (los juristas en sentido amplio), y por el otro, el mundo de los derechos efectivamente actuados, es decir el universo de los destinatarios de la norma, que se confrontan esencialmente con la lengua con está vehiculada la norma.
La terminología jurídica juega un papel fundamental aun cuando el legislador, por opurtunidad, privilegia una terminología ambigua y entrega la interpretación (una o más) al operador obligado a incluir los casos concretos en el marco teórico del texto normativo. Los términos adquieren valor preceptivo en un contexto determinado. Además, cada juez puede ofrecer soplucione interpretativas distintas. Por todo eso el problema terminológico del derecho no se puede resolver sólo en el mundo de los juristas, sin considerar al ciudadano y, especialmente, su derecho a una información clara y unívoca.
La documentación jurídica actual está enfrentándose con este problema. El lenguaje documental se basa en la univocidad de términos y enunciados para poder recuperar la información. En los textos normativos se deben evitar los problemas terminológicos, dado que una norma está insertada naturalmente en un ordenamiento que da lugar a interpretaciones plurales e incluso contradictorias. Por esto no siempre es fácil establecer una equivalencia entre el texto natural y su correspondiente texto documental.
Aquí queda planteada la naturaleza misma de la comunicación jurídica. La norma llega de un emisor y necesita una respuesta activa del receptor, para alcanzar los objetivos del legislador. Como se puede comprender el problema terminológico queda siempre presente en la tarea de la documentación jurídica.
Estos son algunos de los problemas terminológicos que atañen a la lengua jurídica y que actualizan la importancia del estudio del léxico juridico en su evolución histórica y social. Las nuevas tendencias documentales tratan de acercar a juristas y ciudadanos, en una sociedad compleja que obliga a restablecer una cadena eficiente de la comunicación juridica en que los destinatarios de la norma deben volver a tomar la posición de anillo fuerte de este importante proceso de comunicación que, en ámbito jurídico constituye un importante proceso social.
|