
« Lemmes » est l’un des cinq groupes de travail du COnsortium des Sources Médiévales - Cosme2 - soutenu et financé par le TGIR Huma-Num du CNRS pour œuvrer à la constitution de corpus et d'outils numériques, consacré aux sources médiévales, piloté depuis l’IRHT. Le groupe de travail « Lemmes » a pour dessein le développement des outils existants et la diffusion de corpus lemmatisés.
L’objectif de ce troisième atelier du lundi 10 décembre 2018 est de continuer à développer les actions du groupe dans trois axes :
- l’évaluation des outils de lemmatisation pour plusieurs langues médiévales (latin, français, anglais, allemand…) ;
- la diffusion auprès de la communauté scientifique d’une information structurée sur les différents outils et paramètres de lemmatisation et sur des corpus lemmatisés librement disponibles ;
- la formation des chercheurs et jeunes chercheurs aux techniques de formalisation et d’exploitation de corpus textuels médiévaux.
L’atelier est ouvert à tous les intéressés qui sont priés, pour des raisons d’organisation matérielle, de nous informer au plus vite de leur participation (écrire à eliana.magnani@univ-paris1.fr).
Le programme de l’atelier sera diffusé après le 30 novembre 2018, mais d’ores et déjà certaines présentations sont pressenties :
- Les développements de Collatinus pour l’analyse syntaxique, le latin médiéval et les fonctionnalités particulières du tagueur-LASLA (Y. Ouvrard, Ph. Verkerk)
- La constitution du corpus épigraphique bourguignon plurilinguistique et les premiers tests de lemmatisation - CBMA-CIFM (P. Brochard, E. Ingrand-Varenne, E. Magnani, A. Menudier, N. Perreaux)
- Le lemmatiseur-tagueur Hydra pour l’allemand (L. Gagala)
- La constitution d’un corpus en allemand (S. Brisbois)
- Les expériences de lemmatisation de l’anglais avec PALM (A. Mairey)
Liens utiles :
https://www.huma-num.fr/consortiums
https://outils.biblissima.fr/fr/collatinus-web