Cancioneros gallego-portugueses.
De la Paleografía digital a la Gramática histórica.

El Proyecto tiene por objetivo desarrollar un nuevo recurso digital para el estudio de la lengua de la lírica gallego-portuguesa y su variación en la tradición manuscrita. La iniciativa es complemento natural de la base de datos elaborada por el equipo (PalMed) para incorporar las ediciones paleográficas de los manuscritos que transmiten el corpus trovadoresco. Sin duda, PalMed constituye un sólido y eficaz punto de partida para abordar un nuevo objetivo de investigación: el estudio lingüístico de la producción trovadoresca a partir de los datos facilitados por los propios códices. La experiencia en el uso y explotación de la herramienta citada –que, en consonancia con el tipo de ediciones que incorpora, fue concebida expresamente para realizar búsquedas detalladas de carácter paleográfico y grafemático, así como un buen número de tipo codicológico– puso de manifiesto la posibilidad (y utilidad) de diseñar otro producto informático focalizado en el ámbito gramatical. Para colmar esta expectativa, es necesario generar una base de datos que recoja y estructure la información suficiente para abordar el estudio lingüístico de la poesía gallego-portuguesa desde una perspectiva empírica. El diseño y puesta en marcha del recurso pretende optimizar los procesos y las estrategias de investigación en lingüística diacrónica, adoptando como criterio básico el principio de no manipular los textos. A este respecto, cabe señalar que, por razones operativas (y al igual que sucede en otras lenguas), los estudios de gramática histórica del gallego y portugués medievales –así como los propios diccionarios, corpora y bases de datos–  en raras ocasiones han tomado en consideración los datos aportados por los aparatos de variantes de las ediciones críticas, sino que se han basado en el texto establecido por los editores a partir del códice-base. Sin embargo, la propuesta que aquí se plantea contemplará la totalidad del material poético recogido en los manuscritos, para que no se pierda ningún dato relevante sobre el cambio lingüístico y su relación con la dinámica de transmisión textual en el espacio y en el tiempo. Para alcanzar este objetivo y modelar un sistema de recuperación de información flexible para los usuarios, es indispensable lematizar y etiquetar el corpus objeto de estudio con los atributos gramaticales pertinentes. Dado que el especialista se enfrenta a una tradición estratificada en diatopía y diacronía, la existencia de un corpus marcado e incorporado a una nueva plataforma digital permitirá diversas posibilidades de consulta y explotación, al tiempo que proporcionará datos significativos para los estudios de gramática histórica en general. Además, la base de datos planeada ofrecerá información trascendental sobre aspectos tales como el proceso de compilación del material poético, la posible localización de scriptoria en las distintas fases de organización de las antologías o la oportunidad de atisbar la creación de modelos lingüísticos para la poesía lírica. El proyecto propuesto exige, pues, una perspectiva interdisciplinar que aúne la integración de los instrumentos y destrezas procedentes de los ámbitos paleográfico, ecdótico, lingüístico y tecnológico para ofrecer a la comunidad científica la lengua de las cantigas en su dimensión histórico-cultural.

  • Palabras clave: Lírica gallego-portuguesa, Gramática histórica, Paleografía, Crítica textual, Humanidades digitales.

The project aims to develop a new digital resource for the study of the Galician-Portuguese lyrical language and its variations in the manuscript tradition. The initiative is a natural and logical development to the database created by the team (PalMed) and will incorporate the paleographic editions of the manuscripts that contain the Galician-Portuguese lyric. PalMed is a solid and effective starting point for a linguistic study that spurs from the data provided by the codex themselves since it was conceived to carry out detailed paleographic, graphematic and codicological searches. However, its user experience revealed the necessity of designing another digital product specifically targeting the grammatical field.

To fulfill this expectation, it is necessary to generate a database that collects and structures enough information to approach the linguistic study of Galician-Portuguese poetry from an empirical perspective. The design and implementation of the resource will optimize the research strategies and processes in diachronic linguistics, adopting as a basic principle the non-manipulation of the texts. In this regard, it should be noted that studies of the historical grammar of medieval Galician and Portuguese have rarely taken in consideration the data provided by the apparatus of variants of the critical editions, as it happens in other linguistic traditions. Instead, they have been based on the text established by the editors. For operational reasons, this shortcoming also applies to dictionaries, corpora and databases. However, our proposal will contemplate the totality of the poetic material collected in the manuscripts. In this way, no relevant data on linguistic change and its relationship with the dynamics of textual transmission in space and time will be lost. To achieve this and model a flexible information retrieval system for users, it is essential to lemmatize and label the corpus grammatically.

Given that the researcher faces a tradition stratified in diatopia and diachronic, the existence of a labeled corpus incorporated into a new digital platform will open a new array of research possibilities, while providing significant data for general historical grammar studies. In addition, the planned database will offer information on aspects such as the compilation process of poetic material, the localization of scriptoria in the different phases of organization of anthologies, and the opportunity to understand the creation of linguistic models for lyrical poetry. Therefore, the project requires an interdisciplinary perspective that combines the integration of instruments and skills from the paleographic, ecdotic, linguistic and technological fields, to provide the scientific community with the language of cantigas in its historic-cultural dimension.