Reconnaître des visages dans une vidéo en s’inspirant de l’analyse de l’ADN

Transport en commun. ed_davad/Pixabay

Quand la police londonienne a testé un nouveau logiciel de reconnaissance faciale pendant le carnaval de Notting Hill en 2017, non seulement les résultats ont été décevants, mais aussi inquiétants. Le système a en effet détecté incorrectement la présence de 35 suspects connus ce qui a conduit à l’arrestation d’un innocent. En France, les autorités locales de Nice, ville de France la plus équipée en caméras de surveillance par habitant, ont voulu expérimenter la reconnaissance faciale pendant l’Euro 2016, mais le gouvernement ne l’a pas autorisé.

Les systèmes de vidéoprotection sont censés être là pour assurer la sécurité du public. Mais malgré des décennies de développement technologique, ils ne sont généralement pas capables de gérer des situations réelles. Par exemple, lors des émeutes de Londres en 2011, les logiciels de reconnaissance faciale ont contribué à une seule arrestation sur les 4 962 qui ont eu lieu.

En raison des échecs de cette technologie, la vidéoprotection repose encore principalement sur la présence d’agents de sécurité visionnant dans des pièces sombres des heures d’enregistrement vidéo, ce qui est totalement inadapté à la protection du public dans une grande ville.

40 000 caméras à Paris

Alors que la ville de Paris ne disposait que d’une centaine de caméras de vidéoprotection en 2010, le Plan de Vidéoprotection pour Paris (PVPP, 2011-2026), l’a doté d’un système de sécurité comportant plus de 40 000 caméras, en comptant l’accès aux réseaux de caméras des compagnies de transports et d’entreprises privées. De plus, avec les possibilités d’équiper les policiers de terrain de caméras individuelles fixées à leur uniforme ou d’utiliser des drones, non seulement la quantité de vidéos à analyser va continuer à augmenter de manière significative, mais aussi leurs données vont être plus complexes en raison du mouvement constant de ces caméras.

Est-ce réellement utile ? Remarquons tout d’abord que les systèmes actuels de vidéoprotection ne fonctionnent que pour des tâches où l’environnement est relativement contrôlé. Alors que la détection d’intrus dans une zone spécifique, le comptage de personnes franchissant une porte bien définie, et la lecture d’une plaque d’immatriculation peuvent être effectués de manière automatique et précise, l’analyse du comportement d’un groupe de personnes ou l’identification d’un individu dans une rue n’est pas fiable due à la complexité et la variété des scènes d’extérieur.

Caméras de surveillance dans le quartier de La Grande Arche de la Défense. Windsock92/Openstreetmap

Un nouvel outil, la génomique

Afin d’améliorer l’analyse vidéo automatisée, il est nécessaire de produire des logiciels capables d’intégrer cette variabilité plutôt que de la considérer comme une difficulté à éliminer – un changement fondamental. Il s’avère que la génomique est un domaine qui nécessite l’analyse d’une très grande quantité de données extrêmement variables.

Des recherches récentes suggèrent que les logiciels d’analyse vidéo pourraient être considérablement améliorés grâce à des avancées informatiques réalisées dans un domaine complètement différent : l’analyse de séquences d’ADN. En considérant qu’une vidéo est l’observation d’une scène qui évolue d’une manière similaire à celle de l’ADN, les techniques utilisées par ces logiciels d’analyses pourraient transformer les systèmes de vidéoprotection.

Depuis le premier séquençage du génome humain (la lecture des trois milliards de lettres qui constituent notre ADN) en 2001, la production de données génomiques a augmenté à un rythme exponentiel. En raison de leur quantité astronomique et de leur variabilité, d’énormes investissements ont été nécessaires afin de développer des logiciels et des infrastructures informatiques capables de les analyser.

Aujourd’hui, les scientifiques peuvent accéder relativement facilement et à un coût modéré, voire gratuit dans certains cas à des services d’analyse génomique permettant une grande variété d’études, allant de la lutte contre les maladies à la conception de traitements médicaux personnalisés, en passant par l’investigation des mystères de l’histoire de l’espèce humaine.

Un morceau d’ADN séquencé. National Human Genome Research Institute/Wikipedia

L’analyse génomique inclut l’étude de l’évolution des gènes au cours du temps en observant les mutations qui se sont produites. Ceci est curieusement similaire aux objectifs de la vidéoprotection, qui reposent sur l’interprétation de l’évolution d’une scène au cours du temps pour détecter et suivre le mouvement de piétons. En considérant les différences entre les images qui composent une vidéo comme des mutations, les techniques développées pour l’analyse génomique peuvent être appliquées à une vidéo.

Les premiers tests de ce concept « vidéo-mics » ont déjà révélé son potentiel. Mon groupe de recherche à l’Université de Kingston au Royaume-Uni a démontré, pour la première fois, que ce type de vidéos peut être analysé même lorsqu’elles ont été filmées par une caméra mobile. En représentant les mouvements d’une caméra comme des mutations, elles peuvent être détectées, puis renversées afin de stabiliser l’image et qu’une scène apparaisse comme filmée par une caméra fixe.

Caméras intelligentes

Parallèlement, des chercheurs de l’université de Vérone en Italie ont démontré que des tâches de traitement d’images peuvent être encodée de telle sorte que des outils de génomique puissent être utilisés sans aucune modification. Ceci est particulièrement important car une telle approche permet de réduire considérablement les coûts et temps de développement de logiciels.

Combiner cela avec notre stratégie pourrait mener à la révolution promise par la vidéoprotection il y a de nombreuses années. Si le concept de « vidéo-mics » était adopté, la décennie à venir pourrait voir l’arrivée de caméras beaucoup plus intelligentes. Dans ce cas, nous ferions mieux de nous habituer à l’idée d’être reconnu régulièrement dans la rue.