Centre de ressources numérique (CRN) réalisé par l’IRHT et l’École des chartes pour la publication électronique de sources. Le projet financé par ADONIS (TGE-CNRS) a été reconduit et comporte deux axes : la lemmatisation avancée pour le latin médiéval, l’assistance à publication pour les chercheurs par la création d’une interface.
TELMA (http://www.cn-telma.fr) est une plate-forme d’édition électronique, créée et pilotée par l’IRHT et l’EÉole nationale des chartes. Elle peut accueillir en format XML (Extensible Markup Language) et en respectant l’initiative internationale d’encodage des textes TEI (Text Encoding Initiative), toute édition électronique de source ancienne. TELMA contient à ce jour 6 corpus propres de l’IRHT, 8 corpus de l’ENC et un corpus commun (le Dictionnaire de latin médiéval Du Cange). Mais cette plate-forme est aussi destinée à accueillir les publications électroniques d’autres laboratoires du CNRS (2 corpus en cours de publication, l’un sur les lois romaines et l’autre sur des textes en langue guèze). Actuellement, toute l’infrastructure technique de ce centre est hébergée et gérée à l’IRHT et 8 nouveaux corpus sont en cours de réalisation et seront publiés en 2009-2010. De nouvelles pratiques de lecture ou d’interrogation naissent de la constitution de ces corpus relativement normalisés, via des modules d’interrogation relativement fine, en plein texte ou sur des « champs » particuliers interrogeables spécifiquement, seuls ou les uns avec les autres, de manière croisée. On peut certes encore lire les textes sur écran les uns après les autres, de haut en bas, écran après écran, « à l’ancienne »… mais on peut aussi accéder plus rapidement au contenu par ces modules d’interrogation.
Les corpus deviennent de plus en plus grands et ne peuvent être parcourus que par l’assistance d’aides techniques. Il devient donc impératif d’avoir des outils performants de recherche et de navigation. L’une des missions de TELMA et de l’IRHT, dans les années à venir, sera de développer un maximum d’outils d’interrogation et de parcours, afin d’affiner nos modes d’entrée dans les corpus écrits. On ajoutera des modules spécialisés par thème de recherche (en littérature hagiographique, en diplomatique…), des modules lexicographiques ou morpho-syntaxiques, des modules décuplant les capacités sémantiques des listes d’autorité (listes de noms de lieux anciens avec coordonnées GPS actuelles, bases de données prosopographiques multiples…). Ces outils sont d’ores et déjà en cours de conception en partenariat avec les différentes initiatives dans le domaine (TGE Adonis, TEI Council).
.