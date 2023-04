En France, 90 % du transport interne des marchandises est effectué par la route et engendre plus de 9 % des émissions nationales de gaz à effet de serre. Notre dépendance au secteur des transports routiers conditionne l’aménagement du territoire, les infrastructures, les réglementations, et l’action politique.

À cause de son impact climatique, ce secteur – et les services qu’il remplit – est appelé à se transformer. Pour cela, il faudrait comprendre finement les activités de transport routier de marchandises et leurs flux sur le territoire. Par exemple, les entrepôts et les zones logistiques sont-ils répartis et utilisés de manière optimale ? Quelles sont les priorités à établir pour réduire l’empreinte carbone de ces activités ? En optimisant et mutualisant les chargements, les parcours ? Comment favoriser les modes de transport moins polluants (train, fluvial, véhicules électriques) ? Quels effets attendre d’un changement de réglementation ? Comment dimensionner les infrastructures de demain ?

Pour répondre à toutes ces questions, il est utile de connaître, en temps réel, la répartition des véhicules de fret routier sur le territoire. Le problème, c’est qu’il existe peu de données concernant ce secteur, contrairement au fret aérien ou maritime : ces deux derniers sont moins morcelés, et pour des raisons de sécurité, les positions sont connues, ce que l’on peut visualiser notamment via les plates-formes Flightradar24 ou MarineTraffic.

Pour le fret routier en France, les rares études statistiques sont souvent annuelles et nationales (déclarations des transporteurs, collectées et mises en forme par l’Insee et DataLab). Elles représentent l’état du secteur mais ne donnent pas d’information du trafic en temps réel. D’autres études se font à l’échelle locale (enquête ou boucle de comptage) et sont utilisées pour mesurer le transport de marchandises dans une agglomération ou les effets de différentes mesures (livraisons de nuit, autorisations de véhicules, heures de livraison, zones de stationnement).

Mais globalement, la quantité et la qualité des données disponibles à propos du transport routier de marchandises restent faibles par rapport à l’impact qu’a l’activité sur la société. Ceci limite l’efficacité des décisions d’investissement ou de réglementation, qui peuvent être parfois dépassées dès leur mise en œuvre à cause du manque de données en temps réel ou d’une vision trop locale.

Comment compter les camions 24 heures sur 24 à l’échelle d’un pays ?

On peut utiliser des technologies in situ, par exemple des détecteurs le long de la route, et les technologies de collecte et d’analyse de « Floating Car Data », avec par exemple les données GPS ou cellulaires.

Les données GPS permettent une localisation et une estimation de vitesse précises et de plus en plus de véhicules en sont équipés mais elles restent assez peu accessibles (car sensibles pour les entreprises).

Les données cellulaires compensent leur faible précision notamment en s’appuyant sur un grand nombre de dispositifs répartis sur l’ensemble du territoire et il est possible de construire des indicateurs généraux de mobilité, notamment grâce à leur volume important.

Orange, avec le projet « Flux logistiques », tente d’établir un observatoire du transport routier de marchandises, reposant sur l’analyse anonymisée de données de signalisation mobile. Le but est de fournir, en temps réel, des statistiques sur les flux de véhicules de fret routier respectueuses de la vie privée et du secret des affaires.

Nous exploitons les données des objets connectés au réseau Orange, par exemple des modems et applications embarqués dans des poids lourds ou des véhicules utilitaires légers (qui font partie d’une flotte d’entreprise pour la majeure partie d’entre eux), mais pas les données des smartphones.

Cette exploitation se fait en conformité avec le cadre réglementaire de traitement des données personnelles en France : les clients seront informés mais il n’est pas nécessaire de demander le consentement dans un cas comme celui-là, car nous anonymisons les données « à bref délai » (dans les minutes qui suivent leur collecte), respectant ainsi les préconisations de la CNIL.

Visualiser des flux de camions à partir de données du réseau mobile

Nous commençons par la construction d’une base de données expérimentale, à durée de vie limitée, au sein de laquelle l’identifiant de chaque objet connecté est supprimé et remplacé par un pseudo unique. Les données que nous utilisons correspondent principalement aux localisations des différentes antennes auxquelles les objets se connectent au cours du temps.

À l’aide de ces données, on détermine par exemple des vitesses, des directions de déplacements, ou des routes empruntées. Pour ne conserver que les objets embarqués dans des camions, nous utilisons des méthodes de « clustering ». Puis, nous déterminons les flux de camions dans une zone géographique pendant une certaine durée (origines et destinations).

Anonymiser les données

Pour des questions éthiques et légales de protection de vie privée et du secret des affaires, nous appliquons de manière simultanée un algorithme d’anonymisation irréversible, basé notamment sur le k-anonymat et la differential privacy, ce qui garantit l’anonymat des données calculées et permet de les protéger de tout type d’attaque.

Cela permet de respecter les exigences du RGPD et de la directive européenne « Vie privée et communications électroniques » en Europe, et plus particulièrement en France de leurs déclinaisons légales dans la Loi Informatique et Libertés et dans le Code des Postes et Télécommunications Électroniques.

L’idée du clustering est de créer des groupes de véhicules du même type (poids lourd, véhicule utilitaire léger) ayant un comportement similaire (transport longue distance, tournées, trajet, etc.), et de publier le nombre de véhicules présents dans chaque groupe. Cela permet d’éviter de publier des données concernant un véhicule en particulier, ce qui est illégal. De plus, il est nécessaire de bruiter les statistiques calculées, de sorte à les rendre inattaquables, par exemple en modifiant légèrement le nombre de véhicules présents dans les groupes, tout en conservant le bon ordre de grandeur.

Extrapoler les statistiques

La dernière étape consiste à extrapoler le nombre de camions détectés sur le réseau Orange, pour obtenir une bonne approximation du nombre de camions réel. Cette dernière étape est faite à l’aide d’autres sources de données nous donnant le nombre réel de camions à certains endroits du territoire, comme des photos satellites, ou des stations de comptage. Ces sources ne sont pas accessibles en temps réel, un satellite remontant typiquement une photo par jour.

Comment ces données pourraient aider à limiter les impacts du fret routier

Le but de ce projet est de fournir des statistiques en temps réel pour que les acteurs du fret routier puissent améliorer le fonctionnement de ce secteur et en limiter les impacts (empreinte carbone, pollution sonore, stationnement, congestion, etc.) par des actions collectives conduisant à des véhicules mieux remplis, des trajets plus courts ou des reports modaux. Les enjeux sont considérables quand on sait qu’il existe 20 % de kilomètres à vide et des taux de remplissage de l’ordre de 65 % pour les camions en Europe.

De telles données pourraient aider à positionner des hubs de transfert de marchandises sur des flux compatibles entre la route et le ferroviaire ou le fluvial. Les expéditeurs pourraient se servir de ce type de données pour découvrir ces potentiels et mutualiser leurs chargements.

Les collectivités acteurs de l’aménagement du territoire entreraient dans des boucles d’apprentissage renforcées et rapides en mesurant beaucoup plus rapidement (grâce à ces nouvelles statistiques en temps réel) l’effet d’une nouvelle réglementation sur les trajets, les temps de parcours pour les livraisons ou les places de parking en ville.

Dans le cadre de la transition énergétique, les travaux en cours permettront, par la connaissance du nombre des trajets, des arrêts et de leurs horaires, de quantifier les besoins énergétiques sur les principaux axes de circulation. L’identification de véhicules électriques pourrait aider à mieux positionner les bornes de recharge et le dimensionnement du réseau électrique par une connaissance plus fine de la dynamique des besoins.

Ces observations du trafic ouvrent aussi la voie à d’autres applications : comment, à partir de telles statistiques anonymes représentant des quantités de déplacement, modéliser les émissions de gaz à effet de serre ? Pour notre équipe, il s’agira d’établir un état de l’art critique de ces modèles, d’effectuer une première implémentation et de chercher à la valider avec des données de référence. Ces travaux sont engagés depuis le début de l’année 2023.