Intelligence artificielle appliquée au marketing prédictif : mythes et limites

Geralt/Pixabay

Avec le développement des modèles d’analyses de données massives (big data) et les succès récents dans le domaine de l’apprentissage « profond » (deep learning) en intelligence artificielle (IA), le marketing prédictif semble être devenu la réponse incontournable pour de nombreuses entreprises en situation ultra concurrentielle.

Il s’agit, pour l’essentiel, d’analyser les comportements des prospects et des clients à partir des données disponibles en grand nombre, afin d’en déduire des profils types qui permettent ensuite de proposer les produits ou services les plus adaptés.

Réponses en temps réel

Un exemple souvent donné pour illustrer les applications du marketing prédictif est celui des opérateurs ayant accès aux sites que visitent leurs clients, de manière à anticiper les éventuelles résiliations de leur abonnement. Une fois détectés, grâce entre autres à l’étude des sites concurrents visités, les clients sont contactés en amont de leur décision afin de leur faire une offre. Un opérateur aurait ainsi qualifié près de 80 % des profils concernés dans sa base client et obtenu que 75 % d’entre eux restent finalement abonnés.

Il existe, en effet, une masse immense de données personnelles, en particulier sur les réseaux sociaux, qui permettent d’obtenir des informations précieuses pour répondre en quasi temps réel aux besoins et aux envies des consommateurs.

« Minority Report ». Juan Ignacio Rodríguez de León/Flickr, CC BY-NC-SA

Dans une version ultime, le projet du marketing prédictif est de prévoir les besoins non encore formulés par les clients, à l’instar des précogs dans le film Minority Report, qui identifient les meurtriers avant leur passage à l’acte.

Sans vouloir remettre en cause les avantages évidents d’une analyse intelligente des données, il convient toutefois d’en préciser certaines limites, afin de ne pas tomber dans le piège des techno-prophéties miraculeuses.

Corrélations et causalités

La première limite provient du fait, bien connu des statisticiens, que les corrélations ne sont pas des liens de causalité. Nous pouvons illustrer ce point par un exemple humoristique : le nombre de documentaires produits par année, à l’évidence, n’a aucune incidence sur le nombre de porcs abattus pendant la même période et inversement. Pourtant, les deux courbes présentent une similitude presque parfaite avec un coefficient de corrélation de 0,974 (le maximum est 1).

De telles corrélations parasites sont fréquentes et il est nécessaire de mettre en œuvre des analyses prenant en compte le contexte pour les rejeter. Une approche possible pour résoudre ce type de problème est de faire appel à des algorithmes issus de la recherche en intelligence artificielle.

Ainsi, DeepQA, l’architecture logicielle sur laquelle est basé le superordinateur Watson d’IBM, fait émerger plusieurs hypothèses de l’analyse des données massives, qu’elle classe ensuite en fonction d’indices de pertinence et de confiance, avant de choisir la « meilleure » solution au problème posé. Si l’exemple que nous avons donné est évident, d’autres sont beaucoup plus difficiles à évaluer en fonction des domaines et des problèmes envisagés. Par conséquent, il faudra généralement l’apport conjoint de l’IA et de spécialistes humains pour obtenir des résultats significatifs.

Le super-ordinateur Watson d’IBM. Clockready/Wikimedia, CC BY-SA

Une seconde limite est celle des algorithmes généralement utilisés dans les systèmes de recommandation. Pour simplifier, ils sont pour la plupart basés sur le principe d’association d’un client à un profil type qui émerge de l’analyse des données. L’exemple le plus connu peut être résumé par la formule « les clients ayant acheté ceci ont également acheté cela ». À l’instar des chaînes de télévision, dont le programme dépend d’un petit nombre de profils types, on obtient des solutions satisfaisantes pour ces êtres hypothétiques, mais des solutions insatisfaisantes pour les individus.

En outre, ces algorithmes réduisent le panel des solutions mises en avant, rendant plus difficile l’accès à des offres originales et minoritaires. Dans une version extrême, cette démarche freine l’innovation, la diversité et conduit à la « mort » du système. Cette « saturation » par des solutions sous-optimales est un phénomène bien connu des chercheurs en IA s’intéressant aux algorithmes qui s’inspirent de l’évolution biologique (algorithmes génétiques et évolutionnaires ). En d’autres termes, la diversité est essentielle à l’adaptation et l’évolution. Elle l’est donc aussi dans un écosystème économique concurrentiel.

Systèmes complexes

Bien évidemment, ces deux limites font partie des recherches afin d’obtenir des approches algorithmiques plus satisfaisantes. Néanmoins, il existe une troisième limite importante, car plus fondamentale. Il s’agit de la complexité intrinsèque du système composé par un nombre considérable d’agents (les clients, les entreprises, les offres, etc.) interagissant dans un écosystème économique lui-même en coévolution permanente.

Les quatre grandes classes de systèmes dynamiques. J.-C. Heudin d’après C. Langton, Author provided

Un tel système est caractérisé par une dynamique dite « complexe » qui se situe à la frontière entre les systèmes ordonnés (fixes et cycliques), par conséquent prévisibles, et les systèmes chaotiques, proches cousins de l’aléatoire, et par conséquent imprévisibles. Dans cette catégorie, on trouve également les systèmes météorologique, financiers, etc., ainsi que les décisions d’un humain qui émerge de l’interaction des milliards de neurones de son cerveau. Les prédictions dans de tels systèmes sont donc limitées avec des « horizons » relativement courts.

Pour conclure, de l’évocation (non exhaustive) de ces quelques limites, il faut retenir que le marketing prédictif associé à l’IA est certes une approche prometteuse, mais qu’elle ne représente pas la panacée ultime comme on peut le lire ou l’entendre parfois. S’il est certain que l’analyse intelligente des données massives constitue une « révolution » pour le marketing et la communication, elle ne remplace pas l’expérience et la créativité humaine. Elle doit être utilisée au profit de l’utilisateur final, pour lui proposer les offres les plus pertinentes sans pour autant réduire la diversité et l’originalité.