Web littéraire
Actualités
Base de français médiéval. Publication du corpus BFM2019

Base de français médiéval. Publication du corpus BFM2019

Publié le par Université de Lausanne (Source : Céline Guillot-Barbance)

Publication du corpus BFM2019 de la Base de français médiéval :

http://txm.bfm-corpus.org/?command=documentation&path=/BFM2019 .

 

Le graphisme du portail BFM-TXM a été entièrement repensé et embelli à pour cette nouvelle édition.

Les conditions d’utilisation ont été simplifiées et tous les textes sont diffusés sous licence ouverte Etalab (https://www.etalab.gouv.fr/licence-ouverte-open-licence).

Le corpus BFM2019 comprend une quinzaine de nouveaux textes et atteint environ 4 700 000 mots. Tous les textes sont encodés selon les recommandations du consortium TEI, balisés pour le discours direct, automatiquement annotés en morphosyntaxe et lemmatisés. L’étiquetage morphosyntaxique a été vérifié pour 4 nouveaux textes (38 textes vérifiés, soit près de 1 000 000 mots) et la lemmatisation pour 18 textes (environ 400 000 mots).

Le corpus s’enrichit aussi de trois nouvelles éditions originales :

  • La Vie de saint Alexis par T. Rainsford et C. Marchello-Nizia
  • L’image du monde de Gossouin, version en prose, par N. Kanaoka
  • Les quinze joies de mariage, par N. Kanaoka sur la base de l'édition imprimée établie par M. Guéret-Laferté, S. Louis et C. Mira, Rouen, Presses universitaires de Rouen et du Havre, 2009.
  • *

Contact : bfm@ens-lyon.fr