Vous êtes ici

HORAE. Heures : Reconnaissance de l'écriture manuscrite, catégorisation automatique, éditions / Hours - Recognition, Analysis, Editions [2018-2021]

Le projet HORAE (Hours - Recognition, Analysis, Editions) propoe d’étudier les pratiques religieuses de la fin du Moyen Âge à travers les livres d’heures, le plus grand best-seller de tout le Moyen Âge et associe trois partenaires en Humanités et Sciences de l’Ingénieur du public et du privé pour une recherche transdisciplinaire : l’Institut de Recherche et d’Histoire des Textes (IRHT, UPR 841), la société TEKLIA et le Laboratoire des Sciences du Numérique de Nantes (LS2N, UMR6004).

Les livres d’heures, avec plus de 10 000 témoins conservés, forment en effet un ensemble crucial pour comprendre l’univers mental médiéval. Pourtant leur contenu textuel est très peu étudié, alors que la production d’un si grand nombre de manuscrits est un phénomène culturel et industriel capital qui manifeste les profonds changements du monde religieux du bas Moyen Âge, avec, à la fois, le développement d’une production livresque proto-industrielle et le passage de l’économie de la demande à celle de l’offre, mais aussi l’intériorisation de la foi, à une époque où l’encadrement ecclésial devient de plus en plus contraignant. Les livres d’heures sont à la fois des objets de luxe avec des enjeux de mise en scène sociale et des objets intimes, munis de fonctions dévotionnelle, mémorielle, eschatologique.

HORAE combine les compétences et recherches des trois partenaires en intelligence artificielle appliquée à l’analyse d’image par ordinateur, en traitement automatique des langues (TALN), et en histoire du livre et des pratiques religieuses. Le projet a pour ambition de créer une chaîne complète depuis le traitement des images numériques jusqu’à la production des savoirs en plaçant l’utilisateur final au centre des développements, en veillant aux formats, à l’interopérabilité, à la pérennisation des données, mais aussi à l’ergonomie et aux problématiques de visualisation de données massives.

Les objectifs comprennent :

  1. l’utilisation des nombreux manuscrits numérisés présents en ligne et sous-utilisés ;
  2. des nouveaux logiciels open source de reconnaissance d’écri¬ture manuscrite (HTR, Handwritten Text Recognition) adaptés aux manuscrits médiévaux ;
  3. des outils de segmentation et de repérage de plagiat adaptés aux manuscrits médiévaux retranscrits par la machine, afin d’identifier les textes transmis par les livres d’heures ;
  4. le repérage et l’édition des textes inédits ;
  5. la visualisation des ‘clusters’ de manuscrits présentant les mêmes caractéristiques textuelles, avec l’ordre des différentes parties (petit office de la Vierge, offices votifs, suffrages, prières), mais aussi l’ordre des unités textuelles qui permet de repérer les usages liturgiques ;
  6. l’étude de la diffusion et de la circulation des textes dévotionnels et liturgiques transmis par les livres d’heures du Moyen Âge pour mieux comprendre la culture et la foi des xiiie-xvie siècles.

Avec ses objectifs et ses méthodes, HORAE change radicalement les pratiques des sciences de l’érudition en renversant la problématique de la masse de données. Si les livres d’heures ont été jusqu’ici peu étudiés pour leur texte, c’est parce qu’ils sont trop nombreux, trop répétitifs et trop complexes. C’est précisément le nombre, la répétition des mêmes textes et la complexité qui rendront efficace les technologies développées dans ce projet pour parvenir à de nouveaux outils et obtenir de nouvelles conclusions historiques.