Une expérience de traduction poétique : IA vs humain

Une intelligence artificielle (IA) peut-elle traduire un poème de manière satisfaisante ?

D’un côté, les concepteurs de DeepL, la très performante IA qui a traduit en 12 heures un traité d’informatique de 800 pages concèdent que leur création « est parfaite pour les contenus scientifiques mais […] ne saurait pas retranscrire la plume, ni le style d’un auteur ». De l’autre, des intelligences artificielles réussissent déjà à reproduire, à partir d’un échantillon, le style de professionnels de la presse écrite.

Dans une analyse consacrée à la traduction par IA, Sylvie Vandaele estime que le principal danger pour les traducteurs humains vient du robot lui-même que de « nombre d’idées reçues sur l’opération de traduction, dont la complexité est encore largement sous-estimée par le public ». En d’autres termes, alors que les performances de la machine accrochent l’attention, les compétences du traducteur humain resteraient méconnues.

Cette série d’articles intitulée « Le poète, le traducteur et le robot » entend donc, pour contribuer à remédier à cette situation, proposer une « expérience de traduction », inspirée par le regretté Umberto Eco. Ce premier article en définit le protocole : comparer, sur un exemple concret de traduction poétique, le travail humain et le travail machine, afin de réfléchir en connaissance de cause aux implications des développements sur la traduction littéraire, et, plus généralement, sur la traduction, le rapport aux productions culturelles, et le travail intellectuel.

L’expérience sera développée dans les deux articles suivants : le deuxième proposera un texte poétique à une IA traductive, dont on analysera la performance. Ce premier résultat sera comparé, dans un troisième article, à la production d’une traduction par un traducteur humain. On pourra alors tirer quelques conclusions sur ce qui fait l’intérêt et la spécificité de la traduction humaine des textes littéraires et poétiques, et le potentiel de l’IA dans ce domaine.

Mais avant d’entrer dans le vif de la réflexion, il faut préciser le protocole de l’expérience, et avant tout dissiper quelques idées reçues et prendre quelques précautions.

La littérature est-elle supérieure au « reste » ?

Malgré ce « lieu commun opposant la littérature et “le reste” » identifié par Sylvie Vandaele, spécialiste de la traduction scientifique, la traduction littéraire est une activité de traduction parmi d’autres : les textes scientifiques et techniques sont « des produits de la culture soumis à de multiples paramètres » qui demandent une compétence particulière au traducteur. Il ne s’agit donc pas ici de présenter un raisonnement a fortiori dans lequel la traduction littéraire (et poétique) serait « ce qui se fait de mieux » (par opposition à des tâches « subalternes » comme la traduction technique), mais de poser la question de la puissance de l’IA du point de vue d’une pratique traductive à laquelle un universitaire spécialiste de littératures étrangères comme moi a été formé, que je pratique quasi quotidiennement et que j’estime bien connaître.

Qu’appelle-t-on le style d’un texte ?

La notion de style est l’objet de très nombreux lieux communs, qui s’agglomèrent parfois en une véritable « mystique ». Dans le modèle post-romantique qui informe encore le plus souvent le discours sur la créativité, le « style d’auteur » est le sceau du génie littéraire, ou au moins le signe d’une individualité littéraire propre – d’où le fait que quand une IA réussit à reproduire un style, l’auteur humain peut ressentir une forme de blessure narcissique (mise en scène avec autodérision par H.J. Parkinson du Guardian, par exemple).

De cette conception individualiste découle une représentation courante du style comme écart vis-à-vis d’une hypothétique « parole ordinaire » : le grand prosateur/poète s’affranchirait de la grammaire de tout le monde pour se forger une langue à soi ; mais la pertinence de cette représentation est limitée. À l’opposé du discours mystique, certaines des meilleures définitions du style sont d’ordre statistique : le style, comme système formel d’une écriture, se définissant comme la récurrence de patrons (syntaxiques, lexicaux, etc.) – c’est-à-dire comme une règle secondaire de surreprésentation de certaines structures plutôt que comme la transgression des règles de base de la langue.

Si le style peut largement se définir en termes statistiques, il n’est pas très étonnant qu’une IA capable d’apprentissage profond puisse l’émuler – la seule chose que les ordinateurs sachent vraiment faire étant, justement, de calculer très vite. L’argument qui consisterait à disqualifier par principe la traduction littéraire au nom de l’irréductibilité du style semble alors difficilement recevable.

On verra en revanche par la suite que le style comme travail de la langue joue sur les « catégories sauvages » (U. Eco) qui existent chez les locuteurs d’une langue en sélectionnant des articles, des adjectifs ou des constructions syntaxiques plus ou moins admises. C’est une définition plus démocratique du style, non comme transgression géniale, mais comme jeu communicationnel sur l’élasticité des normes sémantiques.

Troisième et dernier lieu commun : « la poésie est intraduisible » ou, au moins, il faut reconnaître que « la poésie traduite est très en deçà de l’original ». Comme le rappelle Claire Placial, la traduction poétique est de facto possible, puisque l’on traduit de la poésie ; la question est alors moins celle de la possibilité que de l’évaluation de la traduction poétique. Il existe assurément beaucoup de mauvaises traductions poétiques ; mais il en existe aussi beaucoup de très bonnes : pour ne citer qu’un exemple prestigieux, Goethe admettait, à la fin de sa vie, lire avec plus d’intérêt la traduction française de son Faust par Nerval (en prose poétique) que son original allemand (en vers).

Les enjeux de l’IA en traduction littéraire

Si la traduction de la littérature et de la poésie en particulier n’est par principe impossible ni pour l’homme, ni pour la machine, une situation de concurrence entre traducteurs humains et IA est envisageable. Cette concurrence peut être appréhendée de deux façons.

Du côté pessimiste, elle peut générer une inquiétude qui viendra s’ajouter à l’épais volume des prédictions inquiétantes relatives aux progrès de l’IA : aura-t-on encore besoin de notre activité de traducteur littéraire ? Outre ses enjeux économiques, n’y a-t-il pas dans ce remplacement la possibilité dangereuse d’une démission de l’élément humain vis-à-vis de pratiques (la traduction ou l’écriture journalistique) qui comportent une dimension éthique.
Du côté optimiste, : la traduction par IA n’a-t-elle pas le potentiel de simplifier la vie aux spécialistes des littératures étrangères en leur épargnant un travail parfois fastidieux dont ils n’ont eux-mêmes pas forcément besoin ? À terme, la possibilité d’obtenir, sur demande et quasi-instantanément, une traduction d’un texte étranger jusque-là inédit dans la langue-cible pourrait représenter une chance pour les étudiants, les universitaires et le grand public d’accéder avec une facilité nouvelle au corpus de la littérature universelle.

Le terme commun à ces deux questionnements est l’exploitabilité des productions de l’IA : sont-elles suffisamment bonnes pour se substituer à l’intervention du traducteur littéraire auprès du public ? La réponse à cette question suppose une définition à la fois technique et normative de la traduction littéraire : comment produit-on une bonne traduction d’un texte littéraire ?

Les « expériences de traduction » d’Umberto Eco

Dans les premiers chapitres de Dire presque la même chose (Dire quasi la stessa cosa, 2003), Umberto Eco se livrait à une série d’« expériences de traduction » en explorant les possibilités du logiciel de traduction en ligne d’Altavista : par exemple, en lui faisant traduire la version anglaise du début de la Genèse dans la Bible du roi Jacques en espagnol, de là de nouveau en anglais, de là en allemand, de nouveau en anglais, et cette dernière version en français. Cette dernière version commençait ainsi :

« Dans Dieu, qui a commencé, placé le ciel et la masse et la masse était sans forme et il y a du vide ; et l’obscurité était sur le visage du profond. »

U. Eco compare ensuite la traduction d’un passage de Moby Dick par Bernardo Draghi à la traduction d’un logiciel fort cher, qui permet sans trop d’hésitation de constater la supériorité du travail humain.

Au troisième chapitre, Eco en venait à « rendre à Altavista ce qui est à Altavista », et prenait comme exemple le premier quatrain de « Les Chats » de Baudelaire, dont il obtenait « une traduction anglaise acceptable ». Si Altavista avait du mal à traiter un texte qui (1) était écrit dans l’anglais du début du XVII^e siècle et (2) pose de toute façon des problèmes d’interprétation même à ses lecteurs humains, il traitait en revanche relativement bien un texte poétique du XIX^e siècle.

Un nouveau protocole pour 2019

L’IA traductive a beaucoup changé depuis 2003, et ses progrès (notamment le développement de l’apprentissage profond) ont pour partie rendues rendues caduques les conclusions d’U. Eco. Il est donc temps de proposer une nouvelle expérience, inspirée par celle d’Eco, mais adaptée aux circonstances de 2019.

Plutôt qu’Altavista, on testera ici GoogleTranslate (GT), qui est probablement le moteur de traduction le plus utilisé aujourd’hui, pour l’évidente raison qu’il est associé au moteur de recherche le plus fréquenté au monde.
Pour éviter les conclusions hâtives, on tâchera d’ouvrir rapidement la boîte noire que constitue l’IA de GT pour le traducteur littéraire. U. Eco tirait un certain nombre de conclusions qui rendaient compte de la traduction automatique en 2003 ; nous disposons, sur le web, de ressources qui nous permettent de comprendre comment fonctionne GT. Outre que cela permettra d’apprécier les progrès fait depuis 2003, ou trouvera là une base de comparaison entre le travail machine et le travail humain.
La question centrale de la concurrence entre traduction humaine et traduction automatique est celle de la performance contre la compétence. Si l’on peut facilement tester la performance de GT sur un échantillon de poésie, il faut aussi rendre compte de l’exercice de la compétence traductive d’un travailleur humain sur le même échantillon. Je me prêterai à l’exercice en décrivant mon processus de travail sur le même texte poétique et en proposant ma traduction.

Reste à choisir un objet de travail : un échantillon de poésie sur lequel faire travailler la machine et le cerveau.

Un échantillon de poésie

J’ai choisi les cinq premiers vers de « Kubla Khan » de Samuel Taylor Coleridge (composé vers 1797-1798) : on testera donc ici la traduction de l’anglais de la toute fin du XVIII^e siècle vers le français d’aujourd’hui.

Voici le texte :

In Xanadu did Kubla Khan
A stately pleasure-dome decree :
Where Alph, the sacred river, ran
Through caverns measureless to man
Down to a sunless sea.

Voici, pour mémoire, la traduction qu’en propose Jacques Darras dans une édition de référence, la collection « Poésie/Gallimard » (p. 187) :

En Xanadu dit Kubla Khan
Qu’on crée un grand dôme de plaisir
Où courrait Alphe, rivière sacrée,
Par des cavernes sans fond pour l’homme
Jusqu’à une mer sans jour !

Ce choix, forcément contestable, peut se justifier par les éléments suivants :

C’est un texte représentatif du discours poétique en général et de la poésie anglaise en particulier. Notre expérience porte sur la traduction de la poésie, et il faut que notre échantillon satisfasse à un critère de représentativité. Ce texte présente des procédés caractéristiques du travail poétique aux niveaux rythmique (tétramètres et trimètre iambiques), phonétique (assonances, allitérations, rimes), syntaxique (la construction de la première phrase), sémantique (le caractère elliptique de la première phrase, l’imagerie), cognitif (le lecteur est confronté à l’évocation d’un univers onirique et lointain). Il me semble donc correspondre à une définition relativement courante de la poésie (lyrique) : un discours mesuré et imagé qui nous introduit dans un univers mental étranger.
Datant de la fin du XVIII^e siècle, ce texte reste cependant accessible à l’IA : sa grammaire respecte des règles qui sont encore celles de l’anglais d’aujourd’hui ; mis à part les noms propres (facilement identifiables comme tels), il ne présente pas de difficultés lexicales particulières.
Ce texte est canonique : Coleridge est un des grands poètes du premier romantisme anglais, et « Kubla Khan » a marqué l’imagination collective (qu’on pense seulement au Xanadu de Citizen Kane) : en le choisissant, on n’essaie pas de « coller » la machine, mais simplement de voir ce qu’elle peut faire d’un texte réputé.
Je suis compétent sur ce texte. Puisque l’atout de l’humain face à la machine est sa compétence, j’ai choisi un échantillon qui relève de mon domaine de spécialité : j’ai une formation d’angliciste, et j’ai consacré ma thèse à la poésie européenne du XVIII^e siècle, notamment anglaise.

Conclusion provisoire

Le poète Wordsworth écrivait, dans la préface des Ballades lyriques (Lyrical Ballads, 1802), que Coleridge et lui souhaitaient introduire dans la poésie lyrique « a selection of language really used by men » – un échantillon de la lange courante. Le choix d’un texte à la fois incontestablement poétique et délibérément proche du langage ordinaire semble tout indiqué pour notre expérience.

Dans la meure où les IA traductives ne sont pas entraînées sur des corpus littéraires et poétique, il évite de « coller » trop facilement la machine (comme c’était le cas, chez Eco, avec la Genèse). Et dans la mesure où il est très poétique, il présente un enjeu technique, mais aussi affectif, pour le traducteur humain. Se mesurer à l’IA sur un tel texte, c’est aussi, pour le traducteur humain, s’exposer au risque de la blessure narcissique : l’expérience n’est pas sans enjeu.

Une expérience de traduction poétique : IA vs humain

Author

Disclosure statement

Partners