Emmanuel Macron vient d’être élu à la présidence de la République sur un programme dont une des priorités est la recomposition de la vie politique. La période que nous traversons, entre les deux tours des législatives, est donc sujette à de fortes interrogations quant à la réorganisation à venir des partis politiques.
Afin d’apporter un éclairage sur ce point, nous avons étudié pendant les semaines qui ont précédé le second tour de l’élection présidentielle les mouvements et transferts entre les partis, avec un prisme particulier, celui du web social. Grâce à notre plateforme Linkage, nous avons analysé en partenariat avec l’entreprise Linkfluence la recomposition des partis sur Twitter, suite au premier tour.
Étude du web social
À partir de tous les tweets des Français liés à la politique, extraits et formatés par Linkfluence, nous nous sommes concentrés sur deux périodes : 17-18 avril et 24-25 avril 2017, c’est-à-dire quelques jours avant, et juste après le premier tour de la présidentielle. La plupart des outils permettant d’analyser ce type de données perçoivent les tweets comme un ensemble de documents : ils ont donc pour objectif d’étudier le choix des mots, les thèmes de discussion majoritaires, et les sentiments relayés par ces messages de 140 signes.
Et pourtant, les tweets sont par nature des données plus riches que de simples documents puisqu’ils caractérisent des interactions entre des individus. Par exemple, un individu A interagit avec B s’il retweete un message de B ou s’il écrit un message faisant référence à B. Un ensemble de tweets est alors vu comme un graphe ou réseau (Figure 1, en tête de cet article). Malheureusement, les outils d’analyse de réseaux sont eux aussi limités et ne peuvent pour l’essentiel gérer que des interactions binaires (interagit ou n’interagit pas) entre les individus.
L’analyse des réseaux est un domaine de recherche particulièrement actif dont un des objectifs est l’extraction automatique d’informations pertinentes au regard des interactions observées entre des individus. Alors que les premiers développements ont été réalisés en sciences sociales dès les années 30, l’immense majorité des outils ont, depuis, été proposés par des physiciens et informaticiens afin de maximiser un critère bien particulier, la modularité.
Ce critère vise à identifier des groupes d’individus ayant plus de connexions entre eux qu’avec des individus d’autres groupes. C’est le principe de la communauté. Nous observons des communautés dans les réseaux sociaux vérifiant le principe de transitivité, c’est-à-dire : l’ami de mon ami est mon ami. Malheureusement, les réseaux en général et sociaux en particulier sont souvent construits à partir d’autres types de groupes. Il existe par exemple des individus ayant une forte influence sur les avis/comportements des autres. On parle alors de groupes d’influenceurs et d’influencés. De la même manière, nous trouvons également régulièrement des structures inversées où il existe plus de connexions entre des individus de groupes différents qu’entre des individus d’un même groupe.
La recherche en mathématiques, et en particulier en statistique, a fourni ces quinze dernières années plusieurs solutions permettant de pallier les limites des outils existants. Ces approches permettent en particulier d’identifier des individus organisés en communautés, mais également en d’autres types d’organisations sociales. La recherche française en statistique a largement contribué aux avancées théoriques et méthodologiques dans ce domaine.
Modèle statistique
Dans le cadre d’une collaboration entre les laboratoires de Mathématiques des universités Paris 1 Panthéon-Sorbonne et Paris Descartes, nous avons proposé un nouveau modèle statistique et une méthode d’estimation associée permettant de réaliser une analyse conjointe d’un réseau et d’un ensemble de textes. Le réseau social à analyser n’est alors plus vu comme un objet binaire. Un individu A interagit avec un individu B sur un texte donné. L’individu A peut par exemple envoyer plusieurs emails à B. Dans ce cas, l’interaction de A vers B est caractérisée par cet ensemble d’emails.
Pour des données de type tweet, une interaction de A vers B rassemble tous les tweets écrits par A faisant directement ou indirectement (retweet) référence à B. L’analyse de ce réseau social permet alors d’identifier des groupes d’individus en fonction de à qui ils s’adressent et de quoi ils parlent. La méthode détermine les thèmes de discussion propres aux échanges entre les groupes. Elle permet ainsi de dire : le groupe A identifié discute beaucoup avec le groupe B, sur le sujet C identifié.
Recomposition politique
La méthode a ainsi été appliquée sur les deux réseaux construits à partir des tweets des 17- 18 avril et 24-25 avril. Elle a identifié cinq thèmes de discussion et dix groupes d’individus, dans les deux cas.

Pour la 1ère période (17-18 avril), quatre des thèmes trouvés correspondent aux tweets des Français à propos des principaux candidats. Il est particulièrement intéressant de constater que le cinquième thème rassemble uniquement les tweets critiquant le système politique en général. Ce thème, au cœur de la campagne, est relayé par tous les partis politiques. Un examen des comptes présents dans chacun des groupes identifiés par la méthode nous a également permis d’étiqueter chaque groupe vis-à-vis de sa tendance politique. Contrairement à tous les partis, le Parti socialiste se retrouve isolé et n’interagit pas ou peu avec le groupe central en gris sur la Figure 2, rassemblant les comptes Twitter des candidats et des principaux médias.
De manière surprenante, les poids des partis que nous avons identifiés se sont avérés proches du vote des Français (figure 3, ci-dessous). 24,1 % des comptes analysés ont ainsi été classés dans le groupe EM. Pour rappel, Emmanuel Macron a obtenu 24,01 % des voix.
Nous avons réalisé une analyse similaire sur la période des 24-25 avril 2017, entre les deux tours de l’élection présidentielle, afin notamment d’observer la recomposition du paysage politique sur le réseau Twitter après les résultats du 1er tour (Figure 4, ci-dessous). Deux thèmes sont associés à EM. Un est uniquement dédié à EM alors qu’un autre rassemble des discussions mentionnant à la fois EM et les Insoumis. Un thème correspond au FN et nous retrouvons deux thèmes de critique dont un de rejet du système politique.
Comme pour le premier tour, nous avons pu identifier le poids des partis sur Twitter. Les résultats bruts donnent 66 % pour EM et 34 % pour le FN. Au vu des résultats du second tour, cette estimation du poids des partis sur le web social est bien sûr troublante. Il est néanmoins important de garder à l’esprit que le web social ne peut pas être directement utilisé aujourd’hui comme source pour le sondage, tout simplement par ce qu’une grande partie de la population française n’est pas présente sur ces réseaux !
Fait rare, notre étude nous a permis de suivre les changements de comportement des comptes entre les deux tours. En utilisant les résultats des analyses sur les deux périodes, il nous a ainsi été possible d’estimer la recomposition du paysage politique à l’issue du 1er tour. Nous avons communiqué ces résultats avant le second tour :
Il nous paraissait important de montrer que, sur le web social, les Insoumis semblaient finalement se tourner vers EM. Ainsi, sur Twitter, plus de 79 % des Insoumis identifiés ont été classés EM après le premier tour. Nous voulions également témoigner de la fracture que nous avions observée à droite. Une part importante des comptes actifs et proches de François Fillon a en effet été classée FN. Contrairement au groupe identifié à droite qui est passé à hauteur de 17 % au FN, le groupe associé à François Fillon est passé à plus de 53 % au FN. Les autres comptes de droite et issus de LR sont allés majoritairement vers EM.