Management et data-science, une discipline émergente en sciences de gestion

Man-machine interface.

Les données massives, les technologies de traitement et la digitalisation bousculent de nombreux cadres, principes et modes opératoires en entreprises. Quels impacts pour les sciences de gestion ? Le big data constitue-t-il un nouveau champ de recherche à part entière ? Si oui, quelles problématiques particulières pose-t-il et quel est son périmètre ?


Chaque minute, il y a dans le monde près de 2 milliards d’octets de données qui sont créés. Ces données massives représentent de nouvelles ressources, de nouvelles opportunités mais également de nouveaux défis à relever. Au confluent entre innovation technologique et management, la gestion et l’analyse de ces données massives intéressent de nombreux secteurs d’activités (télécom, santé, publicité, grande consommation, finance). Elles supposent, également, des mutations profondes au sein des organisations.

Alors que Google ou Facebook fondent leur modèle économique sur les données, la plupart des entreprises sont aux prémices du développement en la matière. Pourtant, lorsque les données massives sont analysées à l’échelle de l’entreprise, les distributeurs, par exemple, augmenteraient leurs marges opérationnelles de plus de 60 %.

Dans un autre contexte, une utilisation efficace des données analytiques permettrait de réduire de 8 % les dépenses de santé. En France, la transformation numérique est devenue un challenge lancé à tous pour répondre aux défis économiques et sociétaux. Une étude prospective, réalisée par Direction générale des entreprises (DGE), souligne l’importance de la data science et formule des orientations stratégiques sur les technologies à industrialiser pour être attractifs et compétitifs dans 5 à 10 ans.

Le rapport Technologies clés 2020 liste 47 technologies stratégiques, avec parmi elles, la valorisation et l’intelligence des données massives, l’intelligence artificielle, l’Internet des objets, les capteurs ou les technologies immersives.

La donnée est donc devenue un actif central et stratégique qu’il s’agit de valoriser. Mais comment l’utiliser et l’analyser afin de guider les décisions stratégiques et opérationnelles ? Quels sont les impacts de la data science au sein des organisations ? Comment modifie-t-elle les différentes fonctions de l’entreprise (marketing, finance, production, etc.), le travail au quotidien, ou encore les relations entre l’organisation et son écosystème ?

Autant de questions auxquelles doit pouvoir aujourd’hui répondre la recherche afin de faire face à ces phénomènes émergents. Cependant, au-delà d’une simple thématique nouvelle, de par la spécificité des phénomènes étudiés, le recours à de nouveaux outils méthodologiques et la fertilisation croisée avec de nombreuses autres disciplines, il nous semble que nous assistons aujourd’hui à l’émergence d’une discipline à part entière. Avant de développer ce point plus avant, une définition de la data science est précisée.

Définition de la data science

La data science fait écho au phénomène big data dont les enjeux pour les entreprises et managers sont particulièrement développés dans la presse professionnelle (p. ex. McAfee et Brynjolfsson, 2012).

Ce phénomène big data est la conséquence d’une évolution technologique liée au développement des capacités de stockage offert par le cloud et à la puissance de traitement que permet les calculs distribués sur des ordinateurs en réseau. Le big data est souvent appréhendé selon les caractéristiques des « 5 V » : le volume (quantité de données créées), la vitesse (flux de traitement en temps réel), la variété (diversité des sources et hétérogénéité des données), leur véracité (fiabilité des données), la valeur (degré d’opérationnalité des données collectées).

La data science, quant à elle, vise plus particulièrement, à gérer – collecter, stocker, visualiser, croiser, analyser et valoriser – en temps réel des données massives, hétérogènes et déstructurées afin de produire une information opérationnalisable, une data-driven decision.

En fait, il s’agit d’extraire des données pertinentes pour le contexte étudié, les smart data (données intelligentes), afin d’envisager une démarche de traitement et de production de connaissances plus efficace. La data science se fonde sur des disciplines comme les statistiques, le data menin et les expertises métiers. Elle se distingue par l’étude systématique de l’organisation et de l’analyse des données ainsi que de la capacité de ces données à permettre des inférences (George et coll., 2016 d’après Dhar, 2013).

Issue de la digitalisation du quotidien (« datafication du quotidien »), la data science est en somme une (r)évolution dans l’analyse, l’exploitation et la valorisation des données. Besse et Laurent (2016) penchent par conséquent pour un véritable changement de paradigme.

Des objets d’études spécifiques

Les challenges de la data science pour la recherche en management sont nombreux (Georges et coll., 2016). Elle concerne toutes les disciplines traditionnelles de la gestion, comme autant de variables de la chaîne de valeur de l’entreprise impactées par l’analytics. C’est le cas, entre autres, pour le « marketing analytics » (Wedel et Kannan, 2016), le « consumer data analytics » (Erevelles et al, 2015), le « human ressources analytics » (Rassmussen et Ulrich, 2015 ; Angrave et coll. 2016) ou la « supply chain analytics » (Gunasekaran et coll., 2017).

De plus, le partage des données et leur confidentialité est aussi une problématique centrale en management (Georges, Haas et Pentland, 2014). Pour les chercheurs, l’enjeu est de produire des théories et connaissances sur les données, la production de valeurs générées par leur traitement, leur contextualisation, ainsi que leur validité et fiabilité des méthodes et résultats obtenus. Les données massives sont un outil au développement de nouvelles théories en management (Georges et coll., 2016).

À titre d’exemple, dans la perspective d’une recherche sur la data science en management, le Marketing Science Institute soulève plusieurs questions prioritaires. Ces questions peuvent s’articuler autour de 3 axes de réflexion :

  • Gestion de données : comment compiler des données de natures diverses pour produire une décision efficace ? Comment améliorer de collecte des données et leur synthèse ?

  • Evolution du cadre conceptuel : Comment intégrer la data science aux théories et cadres conceptuels actuels en management ? Quels rôles pour les neurosciences, l’intelligence artificielle ou le machine learning ?

  • Implications managériales : Comment intégrer l’analytics au processus de décision managériale ? Comment comparer les problématiques et insights soulevés par les traitements de données de ceux émanant d’heuristiques managériales ? Comment les organisations peuvent-elles faciliter la compréhension managériale de ces nouvelles approches complexes ? Quelles nouvelles compétences développer ?

Au-delà de ces questionnements, l’objectif premier, des chercheurs des sciences du management, est d’identifier et comprendre les enjeux des méthodes d’analyses sur les sciences de gestion.

De nouvelles méthodes d’analyses

Au-delà des phénomènes spécifiques auxquels s’intéresse la data science, cette discipline semble devoir faire face à de nouveaux enjeux du point de vue méthodologique, lui conférant ainsi un statut particulier.

Ainsi, l’avènement des données massives rend accessible l’analyse exhaustive d’une population d’individus sans passer par une étape d’échantillonnage. Grâce aux évolutions technologiques, l’observation d’une population entière évite les biais dus aux techniques de sondages.

Par ailleurs, il n’y a plus besoin d’autant de ressources pour organiser la phase de collecte des données. On peut se focaliser directement sur le traitement et la valorisation des données stockées. Seules les étapes de préparation des données, le data munging, qui précèdent l’analyse devient fondamentales car elles permettent la transformation des variables dans un format facilitant l’analyse et impactant la qualité des résultats.

D’autre part, il arrive que le nombre p d’informations disponibles (p. ex. des variables caractérisant un individu ou son comportement) devienne largement plus grand que la taille n des échantillons étudiés (nombre d’individus étudiés). Ce phénomène implique d’adapter les méthodes statistiques car il y a plus d’indétermination que d’information.

De plus, les caractéristiques des données massives (variété, vélocité, etc.), obligent à utiliser de nouveaux outils et méthodes mathématiques pour minimiser les erreurs de prévisions. On assiste à l’importance des algorithmes et au développement de l’usage des techniques d’apprentissage automatique (machine learning) ou des modèles à base de courbes, surfaces ou graphes.

Enfin, la fiabilité des données traitées soulève des questions sur la démarche de collecte des données mais aussi sur les postures et conduites scientifiques à adopter. Par exemple, même si des données de navigation sont collectées, nous ne pouvons pas être certains de l’identité de la personne qui consulte un site Internet. A cet égard, Médiamétrie propose une nouvelle mesure de l’audience couplant à la fois des éléments d’informations collectées via son panel (user-centric) à des mesures de fréquentation (site-centric). Cette mesure hybride serait plus pertinente et plus fiable.

De nouveaux défis transdisciplinaires

Le développement de travaux de recherches vise à faire évoluer les cadres conceptuels classiques en management en intégrant de nouveaux concepts, théories et méthodes issues de la data science. Une nouvelle science se développe sur le principe de la fertilisation croisée entre toutes les disciplines concernées (sciences de gestion, sciences de l’information, statistiques, data mining, neurosciences, intelligence artificielle, machine learning, etc.).

Les opportunités soulevées par les données massives sont majeures pour la recherche, le partage de connaissances ou le processus d’élaboration des politiques publiques. Un rapport de la commission européenne interroge sur les actions à mener pour être un acteur de cette 4e révolution industrielle. Comment inciter au partage des données entre disciplines scientifiques et entre secteur privé et public ? Comment accroître les capacités de traitement ? Le European Open Science Cloud (nuage européen pour la science ouverte) propose une réponse intéressante. Il s’agit d’une initiative européenne permettant de stocker, de partager et de réutiliser des données et résultats scientifiques. Axé en premier lieu sur la communauté scientifique, l’objectif est d’étendre la démarche au secteur public, puis à l’industrie.

Enfin, la data science possède des implications substantielles pour la formation des apprenants (Georges, Haas et Pentland, 2014). En effet, dans un environnement tourné vers la data, il va falloir former les scientifiques des données (data scientist) dont les compétences sont à l’interface entre les statistiques, l’économétrie, l’informatique et la gestion (Wedel et Kannan, 2016). Pour chaque domaine de la gestion, voire les sous-domaines de chaque discipline (p. ex. pour le marketing : la publicité, ou la gestion de marque, etc.) les data collectées diffèrent et leur analyse également. Ces talents sont encore rares car il est difficile de développer une expertise dans chacun de ces domaines. C’est aussi un challenge pour les enseignants en management afin de concilier des formations classiques en management et celles liées à l’analytics ou la data science. Le challenge est de former des managers qui maitrisent l’analytics avec des profils variés allant du manager avec certaines compétences en analytics jusqu’au data scientists et ingénieurs qui intègrent les enjeux de la gestion. Pour l’entreprise, il s’agira de conjuguer ces talents et entretenir ces compétences par des formations et conférences pour rester informée des derniers développements. Il s’agit d’envisager des métiers hybrides, connectés à la data science.

La revue Management & Data Science est une revue scientifique qui a ainsi été développée dans la perspective d’interroger – à travers un écosystème de scientifiques et de professionnels passionnés – l’impact des données massives et de la transformation digitale sur les entreprises.