Colloques en ligne

Judith Deschamps

La mue, la mort et le chant d’une IA

Une voix disparue

1« The question is not ‘how do we find our voice’ but ‘why do we lose our voice’? I start with the assumption that everyone has a voice. If they don’t have a voice, where is their voice? What happens to their voice1 ? ». La voix est un instrument que nous avons toutes et tous. Si cet instrument ne fonctionne plus ou disparaît, que s’est-il passé, et comment le retrouver ? Ces questions formulées par Carol Gilligan dans une interview construite autour de son livre In a Different Voice2 m’interpellent et inspirent une œuvre que je suis en train de réaliser à l’IRCAM (Institut de recherche et coordination acoustique/musique). Je suis artiste plasticienne, doctorante en recherche-création à l’école de recherche ArTeC à l’Université Paris 8, et je travaille sur le rapport qu’entretient la fin de vie avec l’intelligence artificielle (IA). J’emprunte pour cela une méthodologie participative qui s’ancre dans l’expérience sensible d’un établissement d’hébergement pour personnes âgées dépendantes (EHPAD). Ma réflexion théorique s’appréhende ainsi par l’art et par la relation à autrui. Dans le cadre de ma résidence en recherche artistique à l’IRCAM, je compose une œuvre sonore et vidéographique en collaboration avec l’équipe Analyse et Synthèse des sons, dirigée par Axel Roebel. Cette équipe s’intéresse aux méthodes basées sur le « deep learning » (l’apprentissage profond) pour analyser, transformer et synthétiser des sons, en particulier la voix chantée. Je me suis tournée vers elle pour recréer une voix aujourd’hui disparue : la voix du castrat italien Carlo Broschi, dit « Farinelli ». Chanteur baroque du XVIIIe siècle, Farinelli avait subi une castration dans l’enfance : sa voix était au croisement entre celle d’un enfant, d’un homme et d’une femme d’âge adulte ; une voix qui exprime ainsi différents âges et qui se trouve quelque part entre le féminin et le masculin.

2Ce qui me pousse à vouloir recréer cette voix – outre son caractère particulièrement hybride –c’est un rituel nocturne qui a relié Farinelli au roi d’Espagne pendant presque dix ans. Philippe V souffrait de mélancolie et fut subjugué par la voix de Farinelli qu’il entendît un soir à la cour d’Espagne. Il invita ce dernier à rester auprès de lui et à devenir son chanteur personnel. À partir de ce jour, Farinelli berça le roi avec sa voix toutes les nuits jusqu’à la mort de ce dernier. L’histoire raconte qu’il chantait les mêmes airs3, et que l’air préféré du roi aurait été Quell’usignolo che innamorato où Farinelli imitait le chant d’un rossignol4. C’est ce chant, précisément, que je tente de recréer avec l’équipe Analyse et Synthèse des sons à l’IRCAM.

Finitude et castration

Un élément important pourrait venir éclairer l’intérêt qui me porte à revisiter ce chant aujourd’hui. La castration consistait à interrompre la puberté pour maintenir la voix de l’enfant intacte. En coupant le cordon spermatique, le larynx de l’enfant ne grandissait plus, ce qui maintenait la tessiture de sa voix aiguë5. Je perçois dans ce fantasme d’une voix pure et figée dans le temps un lien avec la peur que semble éprouver la société actuelle à l’égard de la vieillesse et de la mort. C’est un problème qui s’est révélé de manière très frappante lors de la première vague de l’épidémie de la Covid-19, où l’on a pu constater à quel point les personnes âgées étaient reléguées aux marges de la communauté. La solitude dans laquelle ont sombré les résident.e.s d’EHPAD a mis en exergue le statut quasi inexistant de ce moment pourtant crucial de la vie humaine. Présente abstraitement sous forme de chiffres et de statistiques, la mort nous est apparue comme une coquille vide de sens6. Dans son article « La mort et la conception de la personne », Maurice Bloch montre que la mort dans la pensée occidentale est perçue comme quelque chose de coupé de la vie du corps, comme si elle arrivait de manière ponctuelle, alors même que la mort est un processus qui pour d’autres cultures commence très tôt dans la vie humaine7. Partant de cette analyse, je me demande si la mue – qui était suspendue par la castration – ne pourrait pas constituer le lieu d’un questionnement sur la mort. En français, le mot réfère à un passage, puisqu’il induit une transformation. En anglais, il renvoie plutôt à une rupture puisque l’on parle d’une voix qui s’arrête ou se casse : the « voice breaks ». 

Deep learning et pluralité

3Dans sa thèse Il novello Orfeo » Farinelli : vocal profile, aesthetics, rhetoric, la chanteuse et chercheuse Anne Desler enquête sur la voix de Farinelli à partir de toutes les partitions qu’il a pu chanter au cours de sa vie8. La méthode et la précision de son analyse permettent d’imaginer la voix du castrat. Une voix d’enfant bien sûr, mais beaucoup plus puissante puisque la cage thoracique de Farinelli et sa cavité buccale et pharyngée étaient celles d’un adulte. Une voix qui se rapproche plutôt d’une mezzo-soprano, chaude, de poitrine, et qui au bout de quinze ans de carrière professionnelle aurait perdu ses notes les plus aiguës pour aller vers un registre plus grave, qui s’apparenterait à celui d’un ténor léger9. Nous nous représentons souvent la voix des castrats comme étant immuable, alors qu’elle changeait elle aussi au cours de la vie. Mon travail à l’IRCAM se construit autour de cette multiplicité de tessitures présentes dans la voix de Farinelli en raison de sa castration, mais aussi de son vieillissement. Plus précisément, il consiste à entraîner une IA avec cinq types de tessitures : deux enfants n’ayant pas encore mué, une soprano, un contre-ténor, une alto et un ténor léger. L’idée étant de pouvoir ensuite les faire fusionner en un chant unique, perçu comme étant chanté par une seule et même personne. Nous nous appuyons pour cela sur l’apprentissage profond, dont les réseaux de neurones apprennent par eux-mêmes à partir d’une base de données, en l’occurrence les enregistrements du chant Quell’usignolo che innamorato que nous réalisons avec les chanteur.se.s en question. Il s’agit alors de permettre à ces réseaux de reconstituer le timbre et la hauteur de chaque voix enregistrée afin, dans un second temps, d’étendre ou d’augmenter la voix de l’alto qui est la plus adéquate pour faire le lien entre toutes les voix, en transposant dans des hauteurs différentes les passages qu’elle ne peut naturellement atteindre lorsqu’elle chante Quell’usignolo che innamorato.

Techne et poiesis

4Dans cette entreprise d’hybridation de voix, un problème intéressant surgit : ma confrontation avec des récits. Au cours de cette recherche, je n’entends pas seulement la voix des chanteur.se.s sur lesquelles les réseaux profonds se basent, mais j’accueille aussi leurs récits. Fabriquant une œuvre à partir de la voix de personnes que je suis amenée à écouter, je me sens responsable vis-à-vis de l’histoire qu’elles véhiculent. Hannah Arendt, dans Condition de l’homme moderne, écrit que la parole révèle notre individualité, elle nous distingue des autres humains et de la pluralité :

Sans l’accompagnement du langage, l’action ne perdrait pas seulement son caractère révélatoire, elle perdrait aussi son sujet pour ainsi dire ; il n’y aurait pas d’hommes, mais des robots exécutants des actes qui, humainement parlant, resteraient incompréhensibles10.

En donnant un agent à l’action, la parole fait apparaître le « qui », la personne dans sa singularité. Et c’est parmi les autres que cette unicité peut émerger. Agir et parler au sein de la pluralité humaine, écrit Arendt, sont la condition de notre apparition au monde humain. Cette articulation entre action et parole pourrait nous être utile pour réfléchir à ce qui relie la techne et la poiesis dans le travail que je réalise à l’IRCAM. En quoi la technique et la création artistique ont elles besoin l’une de l’autre pour permettre à la multiplicité des voix humaines participant au projet de se faire entendre dans toute leur singularité ?

Nous avons d’un côté une machine qui génère et « discrimine » des sons11 selon un système d’apprentissage statistique, et de l’autre les voix humaines auxquels les réseaux se réfèrent, qui sont le fruit ou l’expression d’une histoire unique que la machine ne peut pas percevoir. Et ces voix – muettes pour la machine – ont aussi des visages – là encore invisibles pour cette dernière. Selon Emmanuel Levinas, le visage est le lieu de l’altérité, la source de l’éthique et du politique : « Dès qu’autrui me regarde, j’en suis responsable, sans même avoir à prendre de responsabilité à son égard ; sa responsabilité m’incombe12 ». En m’interpellant, le visage me met face à ma responsabilité vis-à-vis d’autrui. Cette interpellation, qui est à l’origine même de ma subjectivité puisque pour le philosophe le moi se constitue dans la relation éthique et ne lui préexiste en aucun cas, explique le besoin que je ressens de passer du son à l’image, de la voix au visage. J’ai commencé à construire un film autour de ma recherche à l’IRCAM, dans lequel trois des chanteur.se.s prêtant leur voix à l’IA se confient sur leurs mues respectives.

L’une de ces personnes, A., est un garçon soprano de 14 ans. Il va bientôt muer, ce qui va changer beaucoup de choses dans sa vie puisqu’il chantait depuis des années dans un chœur ; le chant faisait intégralement partie de sa vie. Sa voix est très belle et d’autant plus touchante qu’elle va bientôt disparaître.

Une autre de ces personnes, V., est un contre-ténor de 24 ans. Il a fait ce qu’il appelle une « mue silencieuse » : à l’adolescence, il a gardé sa voix aiguë, il semblerait qu’il n’ait pas mué. Inquiets, ses parents ont consulté avec lui un phoniatre, et il a découvert lors de ce rendez-vous qu’il avait inconsciemment rejeté sa voix grave. Dans un extrait du film, il raconte cet épisode avec ses propres mots : « J’ai vécu cette séance comme une séance de torture. J’étais installé dans son fauteuil et il me forçait à descendre ma voix. Il me disait “plus bas, plus bas, plus bas !”. Je me souviendrai toujours du geste qui accompagnait cette parole : “plus bas” ».

5Ces paroles font écho à ce que Carol Gilligan dit de cette voix que nous possédons toutes et tous et qui parfois disparaît. Pour V., sa voix originale est celle que le phoniatre considère comme étant une voix anormale ou déformée. Selon ce dernier, sa vraie voix serait la voix grave qu’il aurait refoulée. Le geste emprunté par le médecin pour le ramener à cette voix soi-disant première et authentique me conduit à réécouter ce que Carol Gilligan dit du patriarcat : « What is patriarchy ? It’s the word ‘hierarchy’, and it means ‘rule of priest’: those people who have a voice, who have direct access to truth and power and knowledge are the fathers13 ».

6Ce dont V. dit avoir souffert pendant son rendez-vous avec le phoniatre, c’est cette parole surplombante, ce savoir sur sa propre voix. La scission entre la voix grave que V. aurait rejetée, et la voix aiguë qu’il aurait gardée parle très fortement du système patriarcal que critique Gilligan. Nos voix dans ce système ne sont pas toutes audibles. Et certaines voix dérangent, viennent troubler la norme.

7E. est la troisième personne participant au film. Elle a le même âge que A., et le chant tient une place très importante dans sa vie. Pour elle, muer serait un drame. Devenir un homme également. Les bloqueurs de puberté qu’elle commence à prendre vont lui permettre de garder sa voix de soprane et d’accéder au genre féminin auquel elle s’identifie depuis toujours.

8En proposant à ces trois personnes de faire un film avec moi, il s’agit d’inventer un espace qui puisse accueillir et donner forme à leurs récits : des récits portés par des voix et par des visages qui s’exposent et nous mettent ainsi face à ce qui nous relie de manière fondamentale à autrui. Pour Levinas « le visage est sens à lui seul14 ». Il est bien plus que des yeux, un nez ou une bouche et déborde du contexte définissant une personne (en l’occurrence ici les chanteur.se.s de l’IRCAM) pour nous faire accéder à un dénuement qu’il qualifie d’» essentiel », à partir duquel la relation éthique se construit.

Le conte

Le film que nous avons commencé à imaginer ensemble prend la forme d’un conte. La voix de Farinelli, dont l’histoire tire sa source, dépassait « les limites de l’ordinaire » et rejoint en cela la définition du merveilleux : ce qui nous plonge dans un ailleurs ou un autre monde. Le centre de recherche à l’IRCAM est lui aussi un autre monde. Nos locaux sont sous terre, pour ne pas être dérangé.e.s par les bruits de la ville, l’air que l’on y respire est artificiel, et des galeries relient les laboratoires aux studios d’enregistrement. Dans cette ambiance souterraine et feutrée, des chercheur.se.s travaillent à l’élaboration d’algorithmes qui ressemblent à des formules magiques. Traditionnellement, le conte initie aux épreuves de la vie, aux passages auxquels l’existence nous confronte. En adoptant ce mode narratif, je souhaite faire dialoguer le lent apprentissage de l’IA avec les différentes « mues » dont les protagonistes du film font l’expérience : le passage de l’enfance vers l’âge adulte vécu par les deux enfants, le passage officiel d’un genre à l’autre que l’une de ces personnes est en train de vivre, et le passage de la vie vers la mort dans lequel ma grand-mère s’engage lentement.

J’ai commencé ma résidence à l’IRCAM alors que j’étais confinée avec ma grand-mère qui a 93 ans. Ses mouvements, sa façon très lente et fragile de marcher, de parler, de se souvenir, sont venus peu à peu incarner la mélancolie du roi d’Espagne. J’ai très vite compris que ce chant que nous recréons à l’IRCAM s’adressait en fait à ma grand-mère. C’est dans ses oreilles que le mélange hybride entre la voix des chanteur.se.s prend tout son sens.

Fragilité commune

9Corine Pelluchon, en parlant d’Emmanuel Levinas dans une émission dédiée à cet auteur15, dit que le visage d’autrui porte sa mortalité. Le visage d’autrui est fait de nudité et tout en m’enjoignant à le protéger, il me renvoie à ma propre vulnérabilité. Cette vulnérabilité commune est au cœur des éthiques du care, et notamment du travail de Joan Tronto16 qui s’est inscrit dans le courant inauguré par Carol Gilligan avec son ouvrage In a Different Voice. Pour Tronto, la vulnérabilité ne s’oppose pas à l’autonomie, mais lui est intrinsèquement liée. L’acceptation de la vulnérabilité est la base de la réflexion sur la condition humaine, puisque comme le rappelle Marie Garrau dans la première partie de son livre consacré aux politiques de la vulnérabilité, elle « s’ancre à la fois dans le dénuement qui est initialement celui de l’être humain envisagé comme être corporel, et dans la dépendance sociale que cet état de dénuement suscite17 ».

10J’ai proposé à l’une des protagonistes du conte d’adresser une lettre à ma grand-mère, « la reine », pour se présenter à elle et lui dire en quoi sa voix pourrait la consoler de la solitude. Elle lui a écrit qu’elle-même avait traversé des épisodes difficiles. Le chant l’a sauvée, et c’est pour cette raison qu’elle pense pouvoir sauver la reine à son tour. Cette lettre m’a permis de réaliser que si Farinelli se rendait toutes les nuits dans la chambre du roi, c’est qu’il devait peut-être en avoir besoin lui aussi. L’écoute attentive du roi apaisait sans doute Farinelli.

11Cette idée me plaît, car avec elle les rôles s’inversent, un échange a lieu. Et c’est ce que le film tente de développer : en portant son attention aux récits que lui font les trois chanteur.se.s tout comme il porte son attention aux gestes et aux paroles de ma grand-mère, une reconnaissance mutuelle se tisse, la reconnaissance de fragilités communes. Fragilités à l’égard du temps qui nous traverse, mais aussi à l’égard de notre exposition aux normes et à l’histoire.

12Fabienne Brugère écrit que « les relations sont éthiques quand elles arrivent à instaurer une règle de réciprocité qui réplique à la dissymétrie initiale, égalise l’agent et le patient18 ». Dans ce travail que je mène ma place n’est pas à l’extérieur, mais dedans. En me reliant aux personnes de ce conte vidéographique, en écoutant leurs récits, en leur donnant un lieu pour exister, je cherche à surmonter ma propre mélancolie face à la disparition relativement imminente de ma grand-mère. Ma vulnérabilité est en jeu dans le lien que je tisse avec les protagonistes du film. Cela rejoint l’attitude que Fabienne Brugère introduit dans son ouvrage sur l’éthique du care, et qui, comme le préconise Carol Gilligan, ne cherche pas à surplomber l’autre, mais à exister dans une forme de réciprocité.

Une co-création humain-machine

13Si repenser l’autonomie du sujet dans la société est un enjeu crucial pour l’éthique du care, il l’est tout autant si nous voulons déjouer les idées reçues que les médias et les promoteurs économiques de l’IA entretiennent à l’égard de l’apprentissage artificiel. Dans sa contribution au volume de la revue Écosystème consacré à l’IA, Grégory Chatonsky écrit :

Si les médias de masse interrogent jusqu’à maintenant l’IA comme la possibilité d’une singularité autonome, c’est sans doute que notre culture a conçu l’être humain comme la tension vers une subjectivité libre, autonome et absolue dont l’artiste, dans sa tour d’ivoire, fut une des figures historiques19.

14Cette figure historique est questionnée par Pascal Mougin lorsqu’il met en exergue le recours qu’ont les artistes à des agents extérieurs dans le processus de fabrication de leurs œuvres20. Comme il le souligne dans son article sur la délégation d’exécution dans les arts et la littérature, ce procédé relève d’une tradition ancienne en art, selon laquelle les grands maîtres de peinture et de sculpture déléguaient la réalisation de leurs commandes à leurs équipes d’atelier. Depuis les avant-gardes du début du XXe, et en particulier l’invention du ready-made par Marcel Duchamp, cette délégation d’exécution ne se réduit plus à une simple relation de sous-traitance. Les œuvres d’art s’élaborent dans un rapport étroit avec toutes sortes de matériaux, d’énergies, de structures sociales et institutionnelles.

15Dans mon travail à l’IRCAM, la technologie est sourde et aveugle aux récits et aux visages qui peuplent l’œuvre que nous réalisons avec elle. Elle déroge au fantasme véhiculé par les médias d’une IA autonome dont « l’intelligence » viendrait remplacer celle de l’humain, et permet ainsi aux protagonistes de se relier pour construire une œuvre ensemble et avec elle. Face à une IA limitée, ayant besoin de l’humain pour fonctionner, un chœur de voix se rassemble, offrant la possibilité à chacun.e d’exprimer ses questionnements, ses inquiétudes ou ses souffrances. L’œuvre s’élabore au sein de ce tissu relationnel que forment les différents protagonistes et la machine. C’est d’ailleurs parce qu’elle ne peut les entendre ni réagir à leurs paroles, que les trois chanteur.se.s s’adressent directement à elle via un faux micro à paillettes pour lui raconter des choses qu’il ne serait peut-être pas possible de lui révéler autrement.

Une re-subjectivation par le machinique

16Dans le sillage de la réflexion portée par Hannah Arendt, cette parole adressée ici à un être technique dénué d’intentionnalité fait apparaître l’acteur humain « annonçant ce qu’il fait, ce qu’il a fait, ce qu’il veut faire21 ». En révélant l’agent, la parole redonne peut-être ainsi un pouvoir d’agir sur le monde. Et ce monde, nous rappelle Fabienne Brugère, est loin d’être homogène et universel. Il est fait de dissymétrie, de disparités et de fragilités diverses. Les récits que font les trois chanteur.se.s à l’IA dévoilent une part de leur intimité, offrant comme Florence Baillet le remarque « un espace pour élaborer d’autres possibles22 ». Dans son introduction à l’ouvrage L’intime et le politique dans la littérature et les arts contemporains, elle analyse la façon dont l’art peut reconquérir l’intime et sa potentialité politique « en décalant le cadrage, en saisissant des lignes imperceptibles et souterraines, afin de mettre à jour des perspectives négligées et de laisser s’élever d’autres voix, dans toute leur singularité et leur diversité23 ».

17Alors que la technique pourrait être perçue dans mon projet comme étant déshumanisante, elle permet au contraire une re-subjectivation en étant portée par un geste artistique. Cela rejoint l’idée développée par Arnaud Regnauld dans « Vers une resubjectivation par le machinique ? » selon laquelle « face à […] la désincarnation des rapports interhumains qu’elle [la machine] entraîne, le geste artistique permet de re-singulariser l’expérience dans une perspective d’action sur le monde24 ».

18Les séquences du film où les chanteur.se.s se racontent, donnant à ce qui relevait jusqu’alors du secret une dimension politique, se déroulent dans ce que j’appelle la « boîte noire ». Cet espace obscur et souterrain fait écho à la complexité de calcul opéré par l’IA, la rendant particulièrement opaque pour l’intelligibilité humaine. C’est de cet endroit que les chanteur.se.s tentent de mettre des mots sur ce qui leur arrive, et par là même de rendre visible et audible des évènements que la machine ignore. En tentant de saisir ce qui est en train de se mouvoir et échappe au travail de l’IA, la parole ouvre ici le champ à d’autres façons d’agir et d’interagir dans le monde.

***

19J’aimerais conclure sur une séquence du film où les trois protagonistes expriment par un chant mêlant chœurs et parties solo les rêves que leur inspirent l’IA, qui s’inspire elle-même de leur voix pour recréer celle de Farinelli :

A :

Immortelle, immortelle ma voix

Chœur (V et E) :

Immortelle, immortelle ta voix

A :

Immortelle, immortelle ma voix sera

Chœur (V et E) :

Immortelle, immortelle ta voix sera

A :

IA, IA, IA, IA, IA

Chœur (V et E) :

IA, IA, IA, IA, IA

A :

IA, IA, IA, IA, IA

A :

Avec toi je braverai la mélancolie

V : E :

la finitude la solitude

V :

Mêlée à d’autres voix ma voix

Chœur (E et A) :

Mêlée à d’autres voix ta voix

V :

Mêlée à d’autres voix ma voix sera

Chœur (E et A) :

Mêlée à d’autres voix ta voix sera

V :

IA, IA, IA, IA, IA

Chœur (E et A) :

IA, IA, IA, IA, IA

V :

IA, IA, IA, IA, IA

V :

Avec toi je serai pluriel

E : A :

unique harmonisé

E :

Sublimée de toute impureté ma voix

Chœur (V et A) :

Sublimée de toute impureté ta voix

E :

Sublimée de toute impureté ma voix sera

Chœur (V et A) :

Sublimée de toute impureté ta voix sera

E :

IA, IA, IA, IA, IA

Chœur (V et A) :

IA, IA, IA, IA, IA

E :

IA, IA, IA, IA, IA

E :

Avec toi je serai une autre

V : A :

retrouvée transformée

E :

IA, IA, IA, IA, IA

Chœur (V et A) :

IA, IA, IA, IA, IA

E :

IA, IA, IA, IA, IA

A :

Immortelle

V :

Mêlée

E :

Sublimée

A :

Immortelle

V :

Mêlée

E :

Sublimée25