El uso de Python en Jupiter-labs fue una herramienta esencial para comparar y analizar las distintas listas de palabras contenidas en los diccionarios.
El código fue útil para realizar algunas de las tareas necesarias para analizar los distintos corpus. Por ejemplo, separar las entradas de su definición, analizar la presencia o ausencia de palabras tanto en la edición princeps como en la segunda, y establecer las coincidencias entre ambas ediciones.
Los dos cuadernos siguientes pueden ayudar a comprender el proceso. Haga clic en sus títulos si desea descargarlos o explorarlos.
Dentro de los diccionarios de Nebrija podemos asistir a un proceso evolutivo hacia la modernidad. La característica más importante es, según Alvar Ezquerra (1988), la eliminación de toda ornamentación medieval y enciclopédica de su definición. Esto supuso la capacidad de reducir el diccionario a una herramienta que ofrece un texto breve para cada entrada, permitiendo así aumentar el número de éstas dentro del diccionario. Nebrija consiguió evitar casi por completo el uso de más de una línea a la hora de ofrecer los equivalentes para cada uno de los lemas tanto en el Lexicon como en el Vocabulario.
Si se comparan las dos ediciones princeps (de 1492 y 1494), la eliminación de ciertos nombres propios de una edición a otra muestra el paso de una tradición clásica a otra moderna.
Como se puede ver en el gráfico As you can see in the graphic, the most used words responded to the reductionist formula "por cosa...", "por aquello..." "por lo mesmo...", etc.
En la búsqueda de pruebas para comprender las diferencias entre la primera y la segunda edición del Vocabulario, nos encontramos con un importante hallazgo relacionado con la aplicación de los principios de Nebrija a la hora de componer la matriz para imprimir sus obras. Entre su descripción podemos encontrar uno de los rasgos más importantes que conformarían la lengua española moderna: "tenemos de escrivir como pronunciamos y pronunciar como escrivimos".
En las ediciones princeps, impresas en Salamanca en 1492 y 1494, la voluntad del autor parece estar más presente que en las siguientes ediciones de los diccionarios. Prueba de esta afirmación son las variaciones ortográficas u ortotipográficas empleadas en ambas ediciones. En las primeras ediciones hay un uso bien definido, aunque no completamente normalizado, de la letra 'u' y 'v' según los principios establecidos por Nebrija en su Gramatica Castellana.
Mientras que en las segundas ediciones, y sus posteriores copias, se intercambia la representación gráfica del sonido /u/ como vocal y como consonante.
Otros rasgos que se pudieron constatar durante el proyecto fueron las variaciones en la tipografía utilizada para imprimir las obras de Nebrija fuera de Salamanca y la forma en que la tradición de cada editor afectaba a los principios propuestos por el autor. Por un lado, encontramos que una parte importante del texto presentado en la Grammatica Castellana (1492) para definir el uso de algunos sonidos y letras, como la /u/, fue reutilizado para la impresión de las Reglas de orthographia (1517). Por otro lado, tenemos un texto impreso cuya ortografía no es coherente con lo que en él se lee. Estos problemas pueden observarse en los siguientes extractos:
Si observamos detenidamente el texto de Reglas de orthographia (a la derecha), impreso en Alcalá en el taller de Arnao Guillen de Brocar, y lo comparamos con el texto de Grammatica castellana (a la izquierda), impreso en Salamanca por Juan de Porras, podemos darnos cuenta de que el uso de la forma redonda y de la forma angular para el sonido /u/ en Reglas de orthographia no coincide con lo establecido en las reglas para su uso.
El proyecto proporcionó varios ejemplos en los que las decisiones tomadas y los errores tipográficos inducían a creer que Antonio de Nebrija, al ser primera persona en establecer las primeras reglas gramaticales y lexicográficas para la lengua vernácula destinada a convertirse en la lengua de un imperio, trató de reforzar el uso de sus principios en su propia obra. Nebrija conocía la importancia de establecer reglas bien definidas entre el castellano y el latín para crear una identidad lingüística. Por ello, una de las conclusiones del proyecto es cuestionar la utilización de la segunda edición del Vocabulario como texto base para la creación de la edición crítica debido a la ortografía que ésta utiliza con respecto al uso de la U y la V.
Tras comparar la lista de lemas de la littera B del Lexicon y la letra B en el Vocabulario tanto en la edición princeps como en el ejemplar de la segunda edición impreso en 1516, los resultados obtenidos no fueron coherentes con la información de los colofones utilizados en ediciones posteriores. Fue necesario hacer el inventario de otras letras (u, x, z) para comprobar si existía un patrón proporcional en la supresión de palabras.
En este punto del análisis, se decidió contar las entradas de cada letra del alfabeto en ambas ediciones del Vocabulario para tener una visión general de las proporciones ocupadas por cada conjunto de palabras en el diccionario. Los resultados se muestran en el siguiente gráfico.
Tras este proyecto, se puede abandonar el uso de números aproximados al referirse al total de entradas de cada diccionario. Gracias al trabajo combinado de IA y ground-truth, se puede afirmar que el Vocabulario de 1494 contiene 19.358 entradas, mientras que la segunda edición de 1513 contiene un total de 15.940 entradas.
En lo que concierne al Dictionarium latino hispanicum, es necesario definir el número total de entradas contenidas en él en 28.989.
Quizá una de las principales razones que afectaron al recuento de lemas en ambos diccionarios fue la falta de paginación. Al no tener sus páginas numeradas, el método más práctico para contar los lemas era obtener el número de páginas y multiplicarlo por el número de entradas, dadas en dos columnas, contenidas en cada página. Gracias al uso de las transcripciones asistidas por IA, pudimos demostrar que este método tan comúnmente utilizado por algunos eruditos era erróneo.
Ofrecemos un diagrama en el que podemos ver las variaciones reales en el formato de dos columnas de 49 y 48 líneas por página, lo que da como resultado 98 o 96 lemas en casi todas las páginas dependiendo del diccionario. El Léxico suele tener 98 entradas por página, mientras que el Vocabulario tiene 96. El siguiente diagrama muestra las páginas en las que se modifica el formato: