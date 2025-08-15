Appel à communications

Intelligence artificielle et corpus numériques :

quand la technologie stimule l'innovation linguistique, terminologique et didactique,

Université de Biskra, 26-27 novembre 2025

Organisé par :

Samir CHELLOUAI et Soraya REFRAFI

Langues du colloque : Français / Arabe / Anglais

Dans un contexte mondial où la numérisation massive des productions langagières transforme notre rapport au savoir, à la langue et aux discours, l’intelligence artificielle (IA) s’impose comme un levier incontournable de mutation épistémologique. La linguistique contemporaine ne peut rester imperméable à ces bouleversements : elle se redéfinit aujourd’hui à travers des approches croisées alliant sciences du langage, traitement automatique des langues (TAL), humanités numériques, analyse textométrique et ingénierie des corpus (Silberztein, 2019 ; Lebart, Salem & Berry, 1998).

Cette convergence interdisciplinaire affecte profondément nos manières de penser, de produire et de transmettre les savoirs linguistiques. En effet, la constitution des corpus numériques – qu’ils soient oraux, écrits, multimodaux, littéraires ou spécialisés – devient à la fois un geste scientifique, politique et technique. Comme le rappellent Habert, Nazarenko et Salem (1997), la constitution d’un corpus est toujours le résultat de choix méthodologiques et idéologiques qui orientent la sélection et l’annotation des données. À cet égard, Pearson (1998) souligne que « la compilation d’un corpus n’est jamais un acte neutre ; elle implique toujours des décisions qui affectent la représentativité et le biais des données collectées ». Les critères de sélection, d’annotation et de structuration posent dès lors une question essentielle de représentativité : quelles variétés linguistiques sont valorisées ? Quelles voix sont ignorées ? Quelles cultures sont invisibilisées dans les corpus actuels ?

Parallèlement, l’essor fulgurant de l’IA dans les sphères scientifiques et médiatiques s’accompagne d’une évolution terminologique accélérée. Les concepts comme apprentissage profond, réseaux de neurones, transformers ou modèles de langage bouleversent les catégories traditionnelles. Dans cette perspective, Gaudin (2003) rappelle que la terminologie est étroitement liée aux dynamiques sociales et scientifiques : elle reflète l’évolution des savoirs et l’institutionnalisation des domaines.

Cette transformation s’observe également dans la didactique des langues. Les corpus – en particulier oraux – constituent « des ressources importantes pour l’apprentissage des langues : phénomènes de collocation et phraséologie, microsyntaxe des entrées lexicales, étude des langues de spécialité, typologie des textes » (Chambers, Mélanges CRAPEL n°31). Lorsqu’ils sont enrichis et analysés à l’aide d’outils numériques ou d’IA, ces corpus renforcent encore leur potentiel pédagogique : extraction automatique de phénomènes linguistiques, contextualisation discursive et adaptabilité pour différents profils d’apprenants. Toutefois, leur intégration en classe doit rester critique : quels outils pour quels publics ? Quelle place pour l’interprétation humaine ? Comment assurer une adéquation avec la diversité des apprenants ?

Enfin, l’irruption de l’IA dans le champ des sciences du langage appelle une réflexion critique sur les savoirs qu’elle produit. Derrière la puissance des modèles statistiques, que disent les biais algorithmiques, les processus de labellisation automatique ou les données d’entraînement sur nos représentations du langage ? Comme l’affirment Ducel, Névéol & Fort (2022), « l’équité et l’absence de biais stéréotypés deviennent des critères de qualité importants à prendre en compte dans les applications de traitement automatique des langues ». Dans cette perspective, la linguistique outillée par l’IA nécessite un regard épistémologique sur ses fondements.

C’est dans cet esprit que s’inscrit ce colloque, qui se veut un espace de rencontre, de partage et de questionnement sur les pratiques linguistiques, terminologiques et didactiques à l’ère de l’intelligence artificielle. Il rassemblera chercheurs, enseignants, doctorants et praticiens autour d’analyses croisées, d’expériences de terrain et de réflexions prospectives.

Objectifs du colloque

Examiner les avancées de l’intelligence artificielle dans la construction et l’analyse des corpus numériques : ce premier objectif vise à comprendre comment l’IA peut être utilisée pour construire des corpus numériques représentatifs et analyser de manière efficace les données linguistiques à grande échelle.

Comprendre l’impact de l’intelligence artificielle sur l’évolution terminologique : il s’agit ici d’analyser comment l’IA influence la création et l’adaptation des terminologies dans différents domaines, ainsi que les implications de ces changements pour la communication et la compréhension linguistique.

Identifier les défis méthodologiques et conceptuels associés à l’utilisation de l’intelligence artificielle dans l’analyse linguistique : cet objectif vise à mettre en lumière les difficultés rencontrées lors de l’application de méthodes basées sur l’IA dans le domaine de la linguistique, et à proposer des pistes pour les surmonter.

Promouvoir une approche interdisciplinaire et collaborative dans l’étude des corpus numériques et de l’intelligence artificielle : en favorisant les échanges entre chercheurs issus de différents domaines (linguistique, informatique, sciences cognitives, etc.), ce dernier objectif cherche à encourager une réflexion holistique sur les enjeux et les opportunités de l’IA dans le domaine de la linguistique et de la terminologie.

—

Les propositions de communication pourront porter sur les thématiques ou les axes suivants :

Axe 1 : Ingénierie des corpus à l’ère de l’IA

Méthodologies de constitution, annotation, et structuration des corpus linguistiques

Problématiques liées à la diversité linguistique et à la représentativité

Outils et plateformes de collecte et d’analyse : avantages et limites

Données issues des réseaux sociaux, forums, blogs : nouveaux terrains, nouvelles méthodes ?

Axe 2 : Terminologie, néologie et IA

Créations terminologiques dans le champ de l’IA (lexiques, dictionnaires, glossaires spécialisés)

Emprunts et transferts de concepts : entre anglais technique, français et langues locales

Traduction et adaptation terminologique : enjeux multilingues

Évolution du sens des concepts dans les discours médiatiques, scientifiques et éducatifs

Axe 3 : Corpus numériques et apprentissage linguistique

Intégration des corpus dans l’enseignement du FLE/FOS/FOU

Didactisation des corpus : quelles modalités ? Quels outils ?

L’IA comme support d’évaluation et d’adaptation pédagogique

Expérimentations en classe ou en contexte universitaire

Axe 4 : Enjeux critiques et épistémologiques de l’IA en linguistique

Biais algorithmiques dans les outils d’analyse linguistique

Légitimation ou marginalisation des variétés linguistiques ?

L’intelligence artificielle est-elle vraiment “intelligente” linguistiquement ?

Réflexions éthiques sur la normalisation des pratiques langagières par les technologies

Calendrier

25 juillet – 25 septembre 2025 : Soumission des propositions

: Soumission des propositions 10 octobre 2025 : Notification des résultats aux participants

25 octobre 2025 : Publication du programme

26 - 27 novembre 2025 : Tenue du colloque

20 février 2026 : Date butoir pour l’envoi des articles

20 mai 2026 : Publication des actes

Modalités de soumission

La possession d’un compte Sciencesconf est indispensable pour la soumission. Précisant la modalité de participation (en distanciel ou en présentiel) et l’axe dans lequel elles s’inscrivent, les propositions, rédigées en français, en arabe ou en anglais, doivent être déposées en ligne sur : https://linguia.sciencesconf.org ,dans la rubrique (Proposer une communication).

Document joint :

Le texte complet de l’appel, au format PDF, est disponible ici : https://linguia.sciencesconf.org/data/pages/Argumentaire_Colloque_Nov_2025.pdf