Nouvelle
Actualités
Sujet de thèse prioritaire (ATILF, 2013-2015)

Sujet de thèse prioritaire (ATILF, 2013-2015)

Publié le par Vincent Ferré (Source : ATILF-CNRS)

Sujet de thèse prioritaire (ATILF, 2013-2015)

Contribution à une étude systématique du lexique de la première Bible en français : édition lemmatisée et construction du lexique du Livre des Juges avec les outils du Dictionnaire du Moyen Français

 Encadrement proposé : co-direction Sylvie Bazin (Université de Lorraine) et Pierre Nobel (Université de Strasbourg).

Insertion scientifique de la thèse

Le projet de thèse s’insère dans la problématique actuelle des projets lexicologiques et philologiques appuyés sur l’informatique, c’est-à-dire des projets qui utilisent l’informatique pour créer de nouveaux outils et ressources qui viennent enrichir l’analyse linguistique des états anciens de la langue. Ainsi ce projet s’inscrit-il précisément dans la nouvelle phase de développement du Dictionnaire du Moyen Français (DMF), qui a vu le jour et s’est développé à l’ATILF, dans le cadre d’une « lexicographie évolutive »[1] indissociable de l’informatique, dont on peut retracer à grands traits les principales étapes : structuration des lexiques en base de données lexicales (2001) ; premières versions électroniques (2003, 2007) ; synthèse des matériaux à partir de la version 2009 ; version actuelle (2012) entièrement synthétisée, mais ouverte à des enrichissements ultérieurs. Le dictionnaire demeure – et demeurera – au cœur du dispositif mis en place pour le construire, mais ce dispositif existe aussi pour lui-même et s’est peu à peu transformé en un véritable espace en ligne au service des textes de moyen français, avec quatre ressources ou niveaux de consultation (dictionnaire, base des lexiques, base des textes et outil d’aide à l’édition), reliées par une navigation hypertextuelle. Aux liens entre le dictionnaire et ses bases, s’ajoutent désormais des liens entre l’outil de lemmatisation, LGeRM (Souvay/Pierrel 2009), et le dictionnaire pour faciliter la construction de nouveaux lexiques et accompagner l’édition de texte électronique (Souvay/Bazin-Tacchella, à paraître).

 

Méthodes et objets de la recherche

1) Il s’agit de mettre à profit dans l’édition critique d’un livre de la Bible en moyen français l’outil d’aide à l’édition du DMF. Cet outil est issu du développement du lemmatiseur, LGeRM, programme conçu au départ pour trouver une solution au problème de la variation graphique dans le Dictionnaire du Moyen Français (Souvay, 2007). Ce développement a été favorisé par des collaborations avec de grands projets d’édition de textes en moyen français, notamment les éditions électroniques de Christine de Pizan et de Froissart[2] et par des expérimentations internes[3].

Le candidat devra donc éditer au format XML TEI le texte choisi en s’interrogeant au préalable sur le balisage nécessaire à l’établissement du texte ainsi qu’au traitement ultérieur des données, notamment lexicologiques. Une fois établi, le texte sera lemmatisé avec LGeRM. Une deuxième étape du travail sera consacrée au traitement des résultats de la lemmatisation qui offrira à la fois les éléments d’interrogation du texte transcrit (mots inconnus, formes ambiguës, etc.) et les matériaux de construction de son lexique. L’aboutissement attendu de cette étape est la rédaction du lexique qui viendra enrichir la base des lexiques du DMF et de façon générale le DMF, en sélectionnant les lemmes retenus et en glosant à partir de l’outil en ligne. Enfin, dans une dernière étape du travail, l’analyse des matériaux et la comparaison avec ceux fournis dans les bases du DMF par d’autres types de textes religieux contemporains, comme les recueils de sermons ou les ouvrages liturgiques en français devrait permettre une approche précise de la formation du vocabulaire religieux en français.

2) Le texte choisi pour cette exploitation systématique des outils d’aide à l’édition et à la construction de lexique est un texte phare dans la transmission culturelle et linguistique en moyen français, puisqu’il s’agit d’un des livres de La Bible Historiale de Guiard des Moulins (1291-1295), considérée comme la traduction biblique la plus copiée et la plus lue au Moyen Âge. Cette Bible historiale, primitive ou complétée au tout début du XIIIe siècle, a été transmise par 144 manuscrits complets ou fragmentaires, auxquels s’ajoutent l’editio princeps (1494-1496) et 26 éditions postérieures à 1500. La vraie Bible française du Moyen Âge est en réalité une Histoire sainte, dans la mesure où Guiard a juxtaposé à la traduction de la Vulgate de Jérôme celle de l’Historia scholastica de Petrus Comestor, conjuguant ainsi l’Ecriture, qui relève plutôt du genre historique ici, et son commentaire scolastique.

L’édition appuyée sur les outils et les bases du DMF du Livre des Juges, qui ferait suite à celle de la Genèse et celle de l’Exode (en cours, sous la direction de Pierre Nobel) permettrait d’enrichir considérablement la base des textes du DMF, d’ajouter un nouveau lexique à ceux qui ont servi à constituer le DMF et à ceux qui continuent d’enrichir la base des lexiques d’un Dictionnaire conçu désormais comme une plate-forme complexe. Le manuscrit de base, ainsi que les manuscrits de contrôle ont déjà été choisis[4] pour les éditions du livre de la Genèse et du livre de l’Exode. Cette continuité et la lemmatisation des textes déjà établis permettront des comparaisons précises et chiffrées entre les différents livres de la Bible Historiale. Un tel projet, en combinant les exigences de l’édition critique et les apports du traitement informatique dans l’analyse du lexique, permettrait de construire solidement les bases d’une étude approfondie de la formation du lexique religieux en français. Le choix de la co-direction obéit à cette double exigence.

Environnement scientifique et institutionnel

La thèse s’inscrira dans les travaux de l’équipe « Linguistique historique française et romane » de l’ATILF, et plus particulièrement dans les recherches menées au sein du DMF, à partir de la lemmatisation des textes de moyen français et la construction de lexiques qui enrichissent et transforment la connaissance théorique et pratique du lexique du moyen français.

 

Vivier des candidats potentiels

Les étudiants qui ont une bonne connaissance des structures de la langue médiévale et des textes d’ancien ou de moyen français, titulaires d’un master de lettres ou d’histoire médiévale ou de sciences du langage ou d’un diplôme équivalent, avec à leur actif une expérience au moins partielle de l’édition critique d’un manuscrit d’ancien ou de moyen français. Les étudiants doivent avoir été sensibilisés aux nouveaux outils et doivent être prêts à se former et à les utiliser à toutes les étapes de leur travail de thèse.

Références bibliographiques

Bazin-Tacchella, Sylvie/Martin, Robert/Souvay, Gilles et collab. : Dictionnaire du Moyen Français : http://www.atilf.fr/dmf (versions DMF 2009, 2010 et 2012).

Bazin-Tacchella, Sylvie (2012) : “Le réceptaire attribué à Jean Pitart, projet d’une édition et d’un glossaire électroniques”, In : Ducos, Joëlle (éd.) : Sciences et langue au Moyen Âge, Paris : PUPS, 269-286.

Bazin-Tacchella, Sylvie/Souvay, Gilles (à paraître) : “Le Dictionnaire du Moyen Français : la version DMF 2010”, Actes du XXVIe Congrès International de Linguistique et de Philologie Romane, Valence (2010).

Pierrel, Jean-Marie/Buchi, Éva (2009) : Research and Resource Enhancement in French Lexicography : the ATILF Laboratory’s Computerised Resources. In : Bruti, Silvia et al. (éd.), Perspectives on Lexicography in Italy and Europe, Newcastle upon Tyne, Cambridge Scholars Publishing, 79-117.

Souvay, Gilles (2007) : LGeRM : un outil de lemmatisation du moyen français. In : Trotter, David (ed.) : Actes du XXIVe Congrès International de Linguistique et de Philologie Romanes, Vol. I. Tübingen : Niemeyer, 457-466.

― (à paraître) : LGeRM : un outil d'aide à lemmatisation du français médiéval. In : Proceedings of the 18th International Conference on Historical Linguistics ICHL 2007, Université du Québec À Montréal. Canada. 2-8 septembre 2007.

― /Pierrel, Jean-Marie (2009) : LGeRM : lemmatisation de mots en moyen français. In : Traitement Automatique des Langues t. 50, n° 2, 149-172.

Souvay, Gilles/Bazin-Tacchella, Sylvie (à paraître), “Construction assistée de glossaires à l’aide des outils du DMF”, Actes du XXVIe Congrès International de Linguistique et de Philologie Romane, Valence (2010).

 

Sur la Bible Historiale :

Fournié, Eléonore (2009), « Les manuscrits de la Bible historiale. Présentation et catalogue raisonné d’une œuvre médiévale », L’Atelier du Centre de recherches historiques (consultable à l’adresse http://acrh.revues.org/index1408.html), 3, 2009.

― « Catalogue des manuscrits de la Bible historiale » (2009), L’Atelier du Centre de recherches historiques (http://acrh.revues.org/index1467.html), 3.

Michel, Bénédicte (2004), La Bible historiale de Guiart des Moulins, édition critique de la Genèse (Thèse, Dijon, Université de Bourgogne), 2004.

Nobel, Pierre (2011), « La traduction biblique », Transmédie, Translations médiévales : cinq siècles de traductions en français (Xe-XVe siècles), Brepols, 2011, vol. I, Etude.