Modéliser la littérature populaire : méthodes computationnelles et évolution des genres dans la fiction de langue française. Soutenance Jean Barré (ENS Paris)
Jean Barré soutiendra sa thèse de doctorat :
Modéliser la littérature de genre : Méthodes computationnelles et évolution des genres dans la fiction de langue française
Vendredi 5 juin 2026, 14h.
Salle des Résistants, ENS, 45 rue d'Ulm, Paris 5e
Préparée au laboratoire Lattice sous la direction de Thierry Poibeau et de Thomas Conrad, la thèse propose une approche computationnelle de la littérature de genre, à travers le roman policier et le roman d'aventures.
Composition du jury :
— Marie-Ève Thérenty (Université de Montpellier III), Présidente
— Evelyn Gius (Université Technique de Darmstadt), Rapporteure
— Matthieu Letourneux (Université Paris-Nanterre), Rapporteur
— Claire Barel-Moisan (ENS de Lyon, CNRS), Examinatrice
— Ted Underwood (Université d'Illinois Urbana-Champaign), Examinateur
— Thomas Conrad (ENS-PSL), Co-directeur
— Thierry Poibeau (ENS-PSL, CNRS), Directeur
La soutenance sera suivie d'un pot auquel vous êtes chaleureusement conviés. Prévenir en amont de sa présence auprès de l'intéressé.
—
Résumé : Cette thèse propose une approche computationnelle de la littérature de genre dans la fiction de langue française, en articulant la théorie de l'intertextualité, la modélisation statistique et une analyse des textes à grande échelle. Elle prend appui sur la prémisse structuraliste selon laquelle les œuvres n'existent pas comme unités closes mais comme nœuds d'un réseau de relations, et soutient que les méthodes computationnelles en constituent une opérationnalisation directe. Elles rendent observables, sur de grands corpus, des régularités et des transformations qui échappent à la lecture individuelle.
La première partie construit ce cadre théorique et méthodologique, autour de la notion d'intertextualité, et de sa pertinence pour la notion de genre. Cette dernière y est définie comme une dimension à la fois interne et externe aux textes. Les études littéraires computationnelles se révèlent être une discipline privilégiée pour traiter les conséquences formelles des dispositifs contextuels spécifiques à la littérature de genre. Il s'agit également de mener une présentation critique des principales méthodes computationnelles employées.
La deuxième partie met ce cadre théorique à l'épreuve sur le roman policier (1866--2020). Elle identifie la signature textuelle du roman policier à partir d'une modélisation supervisée et contrôle la robustesse des résultats en examinant les cas limites. Elle analyse ensuite l'archétype du détective, figure clé du genre par la construction d'un détecteur de détectives. Cela permet de suivre la stabilité et les transformations de l'enquêteur au cours de l'histoire du genre. Enfin, l'étude de la naissance du roman policier montre une sédimentation progressive de trois caractéristiques formelles indépendantes avant la stabilisation médiatique du genre dans les années 1930: la persistance du thème criminel, la centralité du détective dans le récit et la structure prototypique de l'intrigue, tirée du crime vers sa résolution.
La troisième partie change d'échelle et compare le roman policier au roman d'aventures en proposant de prédire leur présence au sein du corpus romanesque des archives de la Bibliothèque nationale de France. Il s'agit ensuite de détecter la signature du genre au niveau de ses scènes stéréotypiques, entre mésaventure et dépaysement. Elle teste enfin l'hypothèse d'une normalisation formelle accompagnant l'avènement des collections spécialisées dans l'entre-deux-guerres, et montre, en mesurant la diversité discursive de ces deux genres avant et après leur cristallisation éditoriale, que cette reconnaissance s'accompagne d'une contraction de l'espace des possibles discursifs.
Abstract :
This thesis proposes a computational approach to genre fiction in French-language literature, articulating intertextuality theory, statistical modelling, and large-scale text analysis. It builds on the structuralist premise that literary works do not exist as self-enclosed units but as nodes in a network of relations, and argues that computational methods constitute a direct operationalisation of this premise. They make it possible to observe, across large corpora, regularities and transformations that elude individual reading.
The first part constructs this theoretical and methodological framework around the notion of intertextuality and its relevance to the notion of genre. Genre is defined therein as a dimension that is both internal and external to texts. Computational literary studies prove to be a privileged discipline for addressing the formal consequences of the contextual apparatus specific to genre fiction. This part also offers a critical presentation of the main computational methods employed.
The second part puts this theoretical framework to the test on the detective novel (1866–2020). It identifies the textual signature of the detective novel through supervised modelling and checks the robustness of the results by examining borderline cases. It then analyses the archetype of the detective, a key figure of the genre, through the construction of a detective detector. This makes it possible to track the stability and transformations of the investigator over the history of the genre. Finally, the study of the birth of the detective novel reveals a gradual sedimentation of three independent formal characteristics prior to the media stabilisation of the genre in the 1930s: the persistence of the criminal theme, the centrality of the detective within the narrative, and the prototypical structure of the plot, drawn from the crime towards its resolution.
The third part shifts scale and compares the detective novel with the adventure novel by attempting to predict their presence within the corpus of novels of the Bibliothèque nationale de France archives. It then seeks to detect the genre's signature at the level of its stereotypical scenes, between misadventure and estrangement. Finally, it tests the hypothesis of a formal normalisation accompanying the advent of specialised collections in the interwar period, and shows, by measuring the discursive diversity of these two genres before and after their editorial crystallisation, that this recognition is accompanied by a contraction of the space of discursive possibilities.