Qui se cache derrière le nom d’Elena Ferrante ?

La chaîne HBO s'apprête à diffuser une série inspirée par la saga d'Elena Ferrante. HBO

Il y a quelques mois, à Rome, se tenaient les 14ᵉ Journées internationales d’analyse statistique des données textuelles (JADT). Cette conférence offre un échantillon assez représentatif de l’analyse des textes par informatique dont l’enjeu n’a cessé de croître avec l’explosion d’Internet. Parmi ces applications, il en est une qui suscite un intérêt soutenu : l’identification de la plume ayant écrit un texte anonyme ou d’origine douteuse. En effet, à la simple lecture d’un texte, cette identification est impossible, même pour un lecteur cultivé connaissant bien les œuvres du véritable auteur. C’est pourquoi l’histoire littéraire comporte un très grand nombre d’œuvres non attribuées ou dont l’attribution reste douteuse.

Elena Ferrante est la plus récente de ces énigmes. Les œuvres parues sous ce pseudonyme connaissent un succès mondial, notamment son Amie prodigieuse (quatre tomes parus en français chez Gallimard). Mais l’auteur·e refuse de tomber le masque.

Lors des JADT de Rome, deux recherches ont été présentées, afin d’établir son identité. Les chercheurs A. Tuzzi, M. Cortelazzo d’une part et J. Savoy, d’autre part, ont utilisé un vaste panel de 150 romans signés par une quarantaine d’auteurs contemporains, dont un certain nombre originaires de Naples et sa région – comme le serait l’écrivain – ou l’écrivaine – qui se dissimule derrière E. Ferrante. Au total, ce « corpus » comporte plus de 10 millions de mots. Au-delà de l’identité possible de Ferrante, c’est donc un panorama de la création littéraire italienne contemporaine qui ressort de ces analyses.

Une convergence d’indices

Premier intérêt de ces deux communications : elles utilisent diverses méthodes d’attribution d’auteur qui aboutissent toutes à identifier la même plume pour les œuvres parues sous les noms d’Elena Ferrante et de Domenico Starnone. Ces conclusions confirment l’enquête de Claudio Gatti qui – suivant la règle classique : « où va l’argent ? » – a identifié Anita Raja comme étant la bénéficiaire des droits d’auteur versés par l’éditeur d’E. Ferrante.

Anita Raja n’est autre que l’épouse de Domenico Starnone. Elle aurait donc servi de « fondé de pouvoir » à son mari. À moins qu’elle n’ait aussi contribué à ces romans. Le pseudonyme choisi n’est pas sans rappeler le nom d’Elsa Morante (1912-1985) qui passe pour avoir pris part à certaines œuvres de son mari Alberto Moravia (1907-1990)… Comme on le voit, le constat d’une même plume ne résout pas tout !

A. Tuzzi et M. Cortelazzo notent également un autre fait intéressant : les dernières œuvres parues sous le nom de Starnone se rapprochent – par leur style – de celles de Ferrante, comme si le premier avait été contaminé par la seconde. La même aventure était arrivée à Romain Gary qui, lorsqu’il travaillait sur les Ajar, n’avait pas pu s’empêcher de faire de l’« ajarisme » dans ses œuvres officielles.

Le parallèle avec Gary ne s’arrête d’ailleurs pas là puisque Domenico Starnone a reçu l’équivalent italien du prix Goncourt (prix Stega) en 2001 (pour Via Gemito) et que E. Ferrante a bien failli le recevoir en 2015 (pour le 4e volume de l’Amie prodigieuse).

Naturellement, l’analyse dépasse la simple identification de cette plume de l’ombre. A. Tuzzi, M. Cortelazzo et J. Savoy sont conscients que l’identification de l’auteur débouche sur une seconde question : « Que pouvez-vous nous apprendre sur cet auteur et sur son œuvre ? » Pour l’instant, ces chercheurs ont identifié un certain nombre de mots ou d’expressions communs à Starnone et à Ferrante et qui ne se retrouvent pas (ou significativement peu) chez les autres auteurs contemporains. Ainsi seraient posés les premiers jalons de ce qui devrait être un jour une « stylistique assistée par ordinateur ».

La distance intertextuelle

Le second intérêt de ces deux recherches est de conclure que la méthode d’attribution d’auteur la plus efficace est celle de la « distance intertextuelle », méthode mise au point comme outil de classification des textes. Cette méthode consiste à superposer les textes par couple et à compter les différences entre leurs vocabulaires respectifs. En dessous d’un certain seuil, l’auteur est le même. Si le principe paraît simple, l’application nécessite une capacité de calcul hors de portée du cerveau humain. Par exemple, le calcul effectué à partir de 150 romans utilisés pour identifier Ferrante représente 11 175 comparaisons (assimilables à des lectures parallèles), ce que l’ordinateur fait en quelques secondes mais qu’aucun lecteur ne pourrait réaliser, même en y consacrant une vie entière.

Cette méthode a déjà un palmarès important à son actif, et pas seulement dans le domaine littéraire. Deux exemples récents illustrent sa solidité et la véritable portée de ces recherches.

En 2015, elle a permis à Cyril Labbé – enseignant-chercheur de l’Université de Grenoble – de découvrir que le catalogue de deux des plus importants éditeurs scientifiques mondiaux, contenait plus de 120 faux articles scientifiques. Le logiciel qui a détecté ces « fake papers » utilise la distance intertextuelle. Les principaux éditeurs scientifiques mondiaux lui soumettent systématiquement les articles qui leur sont proposés dans le domaine de l’informatique et de l’électronique.

En 2017, Jennifer Byrne (biologiste australienne) a été nommée l’une des dix scientifiques de l’année par Nature pour avoir détecté une cinquantaine de fraudes scientifiques dans la recherche sur le cancer. Elle a réalisé ces découvertes à l’aide de la distance intertextuelle adaptée au séquençage de l’ADN. Là encore, ce logiciel – réalisé par le même chercheur de l’Université de Grenoble – est utilisé par des centaines de généticiens du monde entier.

Au-delà de ses aspects anecdotiques, l’affaire Ferrante aidera peut-être les chercheurs en sciences humaines à comprendre – après les éditeurs scientifiques, les statisticiens, les informaticiens ou les biologistes – tout ce que peuvent leur apporter les mathématiques appliquées et l’informatique appliquée à l’étude des textes.

Double your gift to the The Conversation. For a limited time, your donation of up to $1000 will be matched dollar-for-dollar.