Un avanzado buscador de texto manuscrito y de indexación ha permitido indexar la colección de registros “Trésor des Chartes”, conocida como Chancery, y poner al alcance de cualquier historiador para su estudio más de 60.000 páginas sobre la Europa medieval.  

Canal Patrimonio

 

manuscritos medievales

 

Hasta ahora, los especialistas solo habían podido transcribir manualmente unas 500 páginas de esta colección, considerada la fuente más valiosa para entender la historia de Francia y de los países relacionados con ella, que está en la raíz de lo que hoy se conoce como Europa.   Investigadores del Pattern Recognition and Human Language Techonology de la Universidad Politécnica de Valencia (PRHLT-UPV) han desarrollado innovadores métodos probabilísticos de indexación y búsqueda de información textual en imágenes de texto manuscrito, con el que han podido indexar al completo la colección Chancery.  

El desarrollo de este sistema y el logro de indexar con él esta colección es el resultado de una estrecha colaboración de dos años entre tres de los participantes del proyecto multidisciplinar HIMANIS: el IRHT (Institut de Recherche et d’Histoire des Textes), la empresa francesa de procesado de imágenes texto A2iA y el equipo de procesado de texto manuscrito del centro PRHLT de la UPV.   Según explica Enrique Vidal, investigador principal del proyecto por parte del Centro PRHLT-UPV, “gran parte de la historia temprana vigente de Francia y de Europa está hasta cierto punto basada en esta pequeñísima muestra de Chancery”.  

Ahora, con el sistema de indexación y búsqueda desarrollado, los historiadores ya pueden buscar de forma fácil y eficaz la información relevante para sus estudios, en la totalidad de las 60.000 páginas indexadas de esta icónica colección.   La colección contiene registros de actos de la cancillería real francesa durante los siglos XIII y XIV, de gran tamaño y densamente manuscritas en francés medieval y en latín, y más de un tercio de los 50 millones de palabras escritas en estos documentos están fuertemente abreviadas.   Por ello, hasta ahora, solo unos pocos eruditos especializados en este tipo de manuscritos son capaces de leerlos y entenderlos con fiabilidad.  

“Algunos historiadores especulan que, con la información que se va a poder obtener mediante el buscador de texto manuscrito de HIMANIS, algunos capítulos de la historia de Europa podrían necesitar una revisión”, apunta Vidal, quien defiende que “la tecnología de indexación y búsqueda probabilística es original y exclusiva de PRHLT”.   Gracias en parte a la gran eficacia de esta tecnología, apunta, “ha sido posible el importante logro conseguido en este proyecto” y que, en su opinión, sitúa a PRHLT “en una clara posición de vanguardia con respecto a las capacidades actuales de otros grupos de investigación o empresas especializadas en estos temas de todo el mundo”.  

Los investigadores de la UPV están actualmente en contacto con otros equipos de investigación en humanidades de España con objeto de plantear sendos proyectos de indexación similares a Chancery con manuscritos españoles. En concreto, preparan propuestas para indexar algunas partes del Archivo de Indias y del de Simancas, entre otros muchos.   Según han informado desde la UPV, el PRHLT ha sido invitado para formar parte de “Time Machine”, una ambiciosa propuesta de proyecto FET Flagship, que involucra a más de ochenta instituciones de Europa.   El objetivo a largo plazo es procesar toda la información histórica existente en archivos, bibliotecas y museos europeos, para desarrollar un ingente e innovador sistema que permita a los eruditos y público en general “viajar en el tiempo” a través de la Historia de Europa. EFE_   Mónica Collado

IMAGEN: Fotografía facilitada por la Universidad de Valencia de un avanzado buscador de texto manuscrito que ha permitido indexar la colección de registros “Trésor des Chartes”, conocida como Chancery, y poner al alcance de cualquier historiador para su estudio más de 60.000 páginas sobre la Europa medieval. EFE