La linguistique des corpus au XXIe siècle : état des lieux et nouveaux horizons (Marrakech, Maroc)
Appel à communications pour une journée d’étude
La linguistique de corpus est passée d'un simple outil à un paradigme central, plaçant la donnée réelle au cœur de l'analyse. Cependant, face à l'essor massif du Big Data, la discipline risque de se fragmenter entre approches techniques et didactiques. L'enjeu actuel est donc de préserver une démarche critique où l'algorithme soutient l'interprétation humaine sans jamais la remplacer.
—
Au tournant du XXIe siècle, la linguistique de corpus a opéré une mutation épistémologique majeure : s’émancipant de sa fonction de simple auxiliaire méthodologique, elle s’est imposée comme le paradigme central des sciences du langage. Cette « révolution empirique », sous l’impulsion de figures pionnières comme Sylviane Granger, a placé la donnée au cœur d’une interdisciplinarité féconde, articulant la description formelle du système à une analyse fine des processus cognitifs et acquisitionnels.
Toutefois, l’ère du « Big Data linguistique », ce flux social et numérique massif théorisé par Tony McEnery confronte désormais la discipline à un risque de fragmentation entre informatique linguistique, textométrie et didactique. Dès lors, l’enjeu de cette journée d’étude consiste à sauvegarder la cohérence de la recherche face à la tentation du « tout-algorithmique ». Il s'agit, pour reprendre la formule de Damon Mayaffre, de réaffirmer une « herméneutique matérielle » au sein de laquelle l’outil numérique demeure un médiateur critique et non un substitut à l’interprétation.
En interrogeant la manière dont ces ressources transforment l’apprentissage des langues et l’analyse de discours, cette rencontre se conçoit comme un laboratoire d’idées visant à fédérer les pratiques autour des axes suivants :
Axe 1 : Analyse linguistique multi-niveaux
Cet axe se consacre à l’examen des différentes formations du système linguistique par l’exploitation de corpus écrits, oraux ou multimodaux. L’objectif est de décrire finement les phénomènes phonétiques, morphosyntaxiques et sémantiques, tout en accordant une attention particulière aux interfaces entre ces domaines (comme la relation prosodie-syntaxe). Les contributions sont invitées à explorer comment les faits de langue de la flexion au lexique s’articulent avec les dimensions pragmatiques et les stratégies énonciatives propres à l’analyse du discours.
Axe 2 : Ruptures technologiques et nouveaux paradigmes empiriques
À l’heure d'une accélération technologique sans précédent, cet axe interroge le renouvellement des méthodologies en linguistique de corpus face au changement d’échelle des données. Il s’agit de questionner la systématisation du traitement des supports multimodaux (vidéo, oralité, interactions complexes) et les défis posés par le web scraping. La réflexion portera sur les cadres éthiques et juridiques nécessaires pour garantir la validité scientifique des données natives du Web. Enfin, cet axe examine l’impact de l’intelligence artificielle générative et des grands modèles de langage (LLM) sur les protocoles empiriques traditionnels.
Axe 3 : Didactique des langues et linguistique de corpus
Cet axe interroge l'intégration des corpus dans l’enseignement et l’apprentissage des langues (maternelles, secondes ou étrangères). Il s'agit d'analyser comment l’exploitation de données authentiques, qu’elles soient produites par des natifs ou par des apprenants (corpus d'apprenants), renouvelle les pratiques pédagogiques et la conception de manuels. Les contributions pourront porter sur l’apprentissage sur corpus, où l’apprenant devient un « chercheur » explorant les régularités linguistiques, ou sur l'analyse des erreurs et des interlangues. L'objectif est d'évaluer l'apport des outils numériques et de la linguistique outillée pour favoriser une acquisition raisonnée des compétences grammaticales, lexicales et culturelles.
Axe 4 : Linguistique de corpus et sociolinguistique : convergences, limites et interfaces
La sociolinguistique et la linguistique de corpus s’interpénètrent dans l'étude empirique de la langue en contexte, s'appuyant mutuellement sur des données authentiques pour analyser la variation. Leur point de jonction réside dans l'usage de corpus (oraux et écrits) comme outils de description des usages réels. Toutefois, leurs finalités divergent : là où la linguistique de corpus privilégie le traitement quantitatif et informatique (fréquences, collocations, extractions automatisées), la sociolinguistique se focalise sur les corrélations entre faits de langue et facteurs sociaux (variations diachroniques, diastratiques, etc.) pour interpréter les données sous un prisme extralinguistique. Cet axe vise à éclaircir les points de convergence épistémologiques et méthodologiques entre ces deux disciplines, tout en délimitant leurs périmètres respectifs.
—
Modalités de contribution
Les chercheurs et doctorants intéressés sont invités à envoyer leurs propositions de communication au plus tard le 17 mars 2026.
L’envoi des propositions aux deux adresses suivantes :
· y.baggar@uca.ac.ma
Chaque proposition doit impérativement inclure les éléments suivants :
1. L’axe thématique dans lequel s’inscrit la communication ;
2. Le titre de l'intervention ;
3. Le résumé de la problématique et de la méthodologie ;
4. Une courte bibliographie indicative ;
5. L'affiliation institutionnelle (structure d’appartenance de l’auteur).
—
Calendrier et dates clés
· Date limite pour l'envoi des propositions : 17 mars 2026
· Notification d’acceptation : 26 mars 2026
· Tenue de la journée d’étude : Jeudi 2 avril 2026.
—
Coordonnateurs :
BAGGAR Yassine et EDDAMNATI Rachid
Comité d’organisation :
(Professeurs et doctorants)
—
Comité scientifique :
Alaoui Yousfi Khadija, Enseignante-Chercheuse, Département Langue et Littérature Françaises, Faculté des Lettres et des Sciences Humaines, Université Cadi Ayyad, Marrakech.
Baggar Yassine, Enseignant-Chercheur, Département Langue et Littérature Françaises, Faculté des Lettres et des Sciences Humaines, Université Cadi Ayyad, Marrakech.
Bouzrara Samir, Enseignant-Chercheur, Département Langue et Littérature Françaises, Faculté des Lettres et des Sciences Humaines, Université Cadi Ayyad, Marrakech.
Eddamnati Rachid, Enseignant-Chercheur, Département Langue et Littérature Françaises, Faculté des Lettres et des Sciences Humaines, Université Cadi Ayyad, Marrakech.
EL MOUWAHIDI Khadija, Enseignante-Chercheure, Département de Langue et Littérature Françaises, Faculté des Lettres et des Sciences Humaines, Université Cadi Ayyad, Marrakech.
Kaddouri Lahcen, Enseignant-Chercheur, Département Langue et Littérature Françaises, Faculté des Lettres et des Sciences Humaines, Université Cadi Ayyad, Marrakech.
Khatif Leila, Enseignante-Chercheuse, Département Langue et Littérature Françaises, Faculté des Lettres et des Sciences Humaines, Université Cadi Ayyad, Marrakech.
Messaoudi Leila, Enseignante-Chercheure, Département de Langue et Littérature Françaises, Faculté des Langues, Lettres et Art, Université Ibn Tofail, Kénitra.
Oussikoum Souad, Enseignante-Chercheuse, Département Langue et Littérature Françaises, Faculté des Lettres et des Sciences Humaines, Université Cadi Ayyad, Marrakech.
Oussikoum Najat, Enseignante-Chercheuse, École Normale Supérieure, Université Sultan Moulay Slimane, Béni Mellal.
Oussikoum Amal, Enseignante-Chercheuse, Département Langue et Littérature Françaises, Faculté des Lettres et des Sciences Humaines, Université Sultan Moulay Slimane, Béni Mellal.
Rahali Saadia, Enseignante-Chercheuse, Ecole nationale de Commerce et de Gestion, Université Cadi Ayyad, Marrakech.
Senhaji Asmae, Enseignante-Chercheure, Département de Langue et Littérature Françaises, Faculté des Lettres et des Sciences Humaines Dhar El Mehraz, Université Sidi Mohamed Ben Abdellah, Fès.
Soussou Moulay Youssef, Enseignant-Chercheur, Département de Langue et Littérature Françaises, Faculté des Lettres et des Sciences Humaines, Université Cadi Ayyad, Marrakech.
Tazi Chakib, Enseignant-Chercheur, Département de Langue et Littérature Françaises, Faculté des Lettres et des Sciences Humaines Dhar El Mehraz, Université Sidi Mohamed Ben Abdellah, Fès.
Références bibliographiques
Adeline Nazarenko, Benoit Habert, André Salem. (1997). Les linguistiques de corpus. Armand Colin, pp.240.
Benzitoun (C.) & Cappeau (P.), (2025), « Les corpus et leur exploitation », in Encyclopédie Grammaticale du Français, en ligne : http://encyclogram.fr DOI ; https://nakala.fr/10.34847/nkl
Boulton A., Tyne H. (2014), Des documents authentiques aux corpus. Démarches pour l’apprentissage des langues, Paris, Didier.
Damon Mayaffre, (2010). Vers une herméneutique matérielle numérique. Corpus textuels, Logométrie et Langage politique. Histoire. Université Nice Sophia Antipolis.
Damon Mayaffre, (2005), « Rôle et place des corpus en linguistique : réflexions introductives », Texto !, nº 10. En ligne : [http://www.revue-texto.net/Reperes/Themes/Mayaffre_Corpus.html ] (consulté le 27 janvier 2026).
Jacques Marie-Paule, (2005), « Pourquoi une linguistique de corpus ? », La linguistique de corpus, G. Williams éd., Rennes, Presses universitaires de Rennes (Rivages linguistiques), p. 21-30.
Kerbrat-Orecchioni C. (2005), Le discours en interaction, Paris, A. Colin.
McEnery, T., & Hardie, A. (2011). Corpus Linguistics: Method, Theory and Practice. Cambridge University Press.
Rastier François, (2011), La mesure et le grain. Sémantique de corpus, Paris, Champion.
Sylviane Granger et Fanny Meunier (dir.). (2008). Phraséologie. Une étude sur perspective terdisciplinaire Amsterdam – Philadelphie : John Benjamins. xxviii, 422 pp.