Agenda
Événements & colloques
Humanités numériques et texte littéraire traduit. Éditer et analyser des corpus de versions parallèles (Grenoble)

Humanités numériques et texte littéraire traduit. Éditer et analyser des corpus de versions parallèles (Grenoble)

Publié le par Marc Escola (Source : Pascale Roux)

Humanités numériques et texte littéraire traduit : éditer et analyser des corpus de versions parallèles

Mardi 24 septembre 2019

Journée d’étude organisée par Filippo Fonio, Emanuela Nanni et Pascale Roux

 

L’objectif global de cette journée est de se demander de quelle manière et dans quelle mesure les approches numériques peuvent nourrir l’analyse du texte littéraire traduit, ou même ouvrir à celle-ci de nouvelles voies. On s’intéressera en particulier à l’édition numérique de corpus de versions parallèles, à l’exploitation de l’alignement automatique des traductions, aux perspectives qu’ouvre le traitement automatique de la langue (notamment par l’intermédiaire de la linguistique de corpus). On interrogera, plus globalement, l’édition numérique comme support spécifique de l’analyse (stylistique, historique, littéraire, linguistique) des traductions et de celle comparative (traductologique) entre le texte original et les différentes versions.

Sur le plan disciplinaire, cette journée se situe à l’articulation de trois champs : les études littéraires, la traductologie et la linguistique (TAL).

On propose de penser ensemble les cas que l’on pourrait rassembler sous l’étiquette générique de « corpus de versions parallèles ». Cette étiquette s’apparente à et se distingue de celle de « corpus parallèle[1] », utilisée en traduction et en linguistique, où les différentes versions d’un texte sont unies, deux à deux, par une relation de traduction. Dans ce que nous appelons « corpus de versions parallèles », les différentes versions d’un même texte, qui peuvent être dans la même langue, ne sont pas nécessairement unies par paires par une relation de traduction. Mais, dans tous ces cas, on identifie une séquence textuelle qui existe dans différentes versions, que l’on veut rapprocher et comparer.

Un corpus de différentes versions traduites en français d’un texte de départ (par exemple plusieurs traductions en français d’un même texte, ou encore un corpus rétrotraduit), peut être abordé soit en tant que corpus parallèle (c’est-à-dire que chaque texte français est analysé comme résultant de la traduction d’un texte en langue étrangère comme lorsqu’on adopte une démarche traductologique), soit comme un ensemble autonome, indépendamment de l’opération de traduction dont il résulte. Dans ce dernier cas, on  comparera les versions françaises entre elles, leurs points communs et leurs différences, on abordera ce corpus en termes de variations de la langue et du style, d’un point de vue diachronique ou synchronique, on analysera la relation qui peut être établie entre les caractéristiques d’un texte traduit et l’histoire littéraire et/ou l’histoire de la traduction.

Cette étiquette de « corpus de versions parallèles » rassemble donc deux types au moins de corpus :

1) les corpus parallèles de textes traduits multilingues (textes traduits dans différentes langues, éventuellement rétrotraduits ou en chaînes de traductions)

2) les corpus unilingues de textes traduits, que l’on a pour objectif de comparer entre eux, indépendamment de l’opération de traduction dont ils résultent (par exemple le recueil de traductions en français d’un texte, ou encore un ensemble de textes rétrotraduits que l’on compare entre eux et avec le texte de départ, sans prise en compte de la relation qui les unit avec des versions en langues étrangères)

Nous nous intéresserons à la fois à l’édition numérique de corpus de versions parallèles et à leur analyse (TAL et étude littéraire).

L’édition numérique de corpus de versions parallèles

L’édition numérique a, par rapport à l’édition traditionnelle, pour évident bénéfice la structuration intelligente de corpus complexes, ainsi qu’une circulation facilitée, pour la lecture ou l’analyse, dans ceux-ci. Elle est ainsi particulièrement développée, dans le champ littéraire, pour ce qui concerne l’édition de correspondances et celle de brouillons. Elle l’est bien moins pour les corpus de traductions, qui posent des problèmes spécifiques, en particulier liés à l’alignement de versions qui peuvent être multiples et parfois très différentes, y compris sur le plan formel.

·      Pistes à explorer (liste non limitative):

-      Comment présenter les corpus parallèles pour que l’utilisateur puisse les manipuler et les exploiter ? Comment tirer parti de l’alignement des versions traduites ?

-      Comment structurer l’ensemble du corpus de manière cohérente pour une exposition intelligente et stratégique des données ?

-      Quelles unités isoler dans le texte : unité graphique (paragraphe, strophe, vers), unité phrastique, mot, unité rhétorique (découpage du texte sur des critères typologiques, par exemple alternance entre séquences narratives et séquences discursives[2]) ? Comment définir ces unités, qu’est-ce qui est techniquement réalisable ?

-      Comment mettre en place un alignement des versions (ou du texte original avec une ou plusieurs versions) qui soit efficace ? Peut-on intégrer l’édition de concordanciers exploitables par l’usager ?

-      Comment intégrer et exploiter des données paratextuelles (préfaces, indications sur les éditions…) dans les corpus parallèles ?

-      Est-il possible d’envisager des appropriations par les chercheurs (système d’annotations non publiques, avec différentes possibilités de visualisation et recherche) ?

-      Qu’apporte l’outil numérique à l’édition de ce type de corpus ?

Analyser les corpus de versions parallèles : TAL et étude littéraire

Les corpus parallèles et leur exploitation numérique, en particulier grâce aux outils du traitement automatique des langues, sont déjà largement théorisés et expérimentés dans les domaines de la linguistique et de la traductologie et on gagnerait à s’approprier les procédures mises en place par ces disciplines, en prenant en compte la spécificité de l’approche littéraire, lorsqu’elle analyse soit des corpus parallèles (abordés dans la relation de traduction que les textes entretiennent), soit des corpus de versions parallèles (comparés mais n’émanant pas d’une opération de traduction ou bien, s’ils en résultent, abordés indépendamment de celle-ci).

·      Pistes à explorer (liste non limitative) :

-      En quoi les outils de l’analyse textométrique des corpus parallèles peuvent-ils enrichir l’analyse de textes littéraires ? Au service de quel(s) type(s) d’approche peuvent-ils être : la stylistique, l’histoire des littératures et des traductions, celle de la langue, la traductologie ? Se prêtent-ils plutôt à une approche en synchronie ou en diachronie des phénomènes repérés ?

-      Ces outils peuvent-ils être utiles dans le cas de ce que nous appelons les corpus de versions parallèles, et en particulier ceux qui sont intégralement en français et ne font pas l’objet d’une approche par couples (dans un corpus de traductions en français, on n’identifie pas, par exemple, un texte qui pourrait être considéré comme la référence à laquelle tous les autres pourraient être comparés) ? Peut-on les mobiliser pour l’étude d’un corpus de traductions en français dans lequel on n’identifie pas un texte-référence, auquel tous les autres seraient comparés ?

-      Peut-on mesurer et décrire la distance entre les caractéristiques de la langue d’une traduction en français et celle de l’ensemble de la production littéraire d’une époque (autrement dit mesurer et isoler des éléments nous permettant de décrire la dimension historiquement marqué de cette traduction) ? Est-ce techniquement possible? Existe-t-il des corpus de référence exploitables pour les différentes époques[3] ?

-      Dans un corpus rétrotraduit, peut-on identifier des séquences[4], dans le texte de départ, qui favorisent la distorsion traductive et d’autres qui, au contraire, favorisent une forme de stabilité, c’est-à-dire de conformité des textes rétrotraduits à ceux de départ, ou au moins de proximité ? Peut-on formaliser une série de rapports entre la langue de départ et la langue d’arrivée (une espèce de « distanciomètre ») ?

-      Comment réaliser et exploiter des concordanciers qui soient adaptés aux spécificités du corpus, c’est-à-dire, en fonction des besoins, unilingues, bilingues ou multilingues ? Qu’est-ce que de tels concordanciers pourraient permettre de mesurer ou d’identifier (des caractéristiques de la langue (littéraire), d’un point de vue diachronique ou synchronique, de la langue d’un traducteur ou d’un groupe de traducteurs face au même texte ou à plusieurs…) ?

*

Cette journée d’étude est organisée par le programme Poétique et stylistique du texte traduit (UMR Litt&Arts, Université Grenoble Alpes).

Elle se situe dans la continuité d’une expérimentation de traduction et rétrotraduction avec Gérard Macé : http://ouvroir-litt-arts.univ-grenoble-alpes.fr/revues/actalittarts/224-l-epreuve-de-l-etranger, portée par Filippo Fonio (Litt&Arts), Emanuela Nanni (ILCEA4) et Pascale Roux (Litt&Arts)

 

 

[1] Un corpus parallèle est défini, en linguistique et en traductologie, comme constitué d’un ensemble de couples de textes dont l’un est la traduction de l’autre.

[2] Nous pensons ici au cas de l’Iliade et l’Odyssée, qui se prêtent à un découpage de ce type.

[3] Voir Olivier Kraif, « Traduire le polar : une étude textométrique comparée de la phraséologie du roman policier en français source et cible », Synergies Pologne, n° 14, 2017, p. 43-60. 

[4] Plus ou moins longues, du mot à la phrase et peut-être à des unités supérieures.