Chaque année, des centaines de milliers de personnes partent de chez elles et quittent leur pays à la recherche d’une vie meilleure ou pour fuir des violences. Beaucoup sont blessées ou tuées durant leur trajet. Beaucoup d’autres disparaissent sans que leurs proches ne sachent si elles sont vivantes ou mortes, ni ce qui leur est arrivé.
Selon le projet Migrants disparus de l’Organisation internationale pour les migrations (OIM), on a ainsi perdu la trace de 45 000 migrants dans le monde depuis 2014, dont 24 000 en Méditerranée.
En 2020, Le Groupe INSA (Institut national des sciences appliquées) a été approchée par l’équipe forensique transrégionale du Comité international de la Croix-Rouge (CICR), qui avait pour but d’améliorer le processus d’identification des migrants décédés dans la zone euro-méditerranéenne. Ici, on dénombre beaucoup de noyades – 16 000 depuis 2014. À notre connaissance, cet effort dirigé par l’anthropologue Jose Pablo Baraybar du CICR est le seul qui se confronte à cette problématique de manière transverse dans la région.
Les équipes des INSA sont ainsi intervenues pour proposer des solutions à ce travail d’identification essentiel du CICR, qui doit faire face à un grand nombre de cas, des informations éparses ou de faible qualité sur les personnes disparues.
Après un projet pilote conduit par l’INSA de Lyon, qui a permis de fournir au CICR des outils de gestion des informations sur les corps récupérés, le partenariat s’est structuré. Il a intégré le programme Alliances de la Fondation INSA.
Ce programme mobilise élèves et enseignants-chercheurs sur des cas concrets pour lesquels des ONG, comme Handicap International ou le CICR, ont besoin d’expertise scientifique et technique. En tout, ce sont 37 élèves qui, dans le cadre de leur cursus, ont développé sept projets alliant méthodes et outils propres aux écoles d’ingénieurs avec les connaissances de terrain du CICR.
L’intelligence artificielle au service de l’humanitaire
En théorie, le processus d’identification des personnes noyées pourrait facilement être initié en faisant reconnaître les défunts par leurs proches à l’aide de photographies. Ces documents ne sont toutefois pas toujours « montrables » : soit ces photos sont de mauvaise qualité, soit les corps sont tellement abîmés et les images tellement traumatisantes qu’elles empêchent toute reconnaissance formelle.
Cette situation nous a conduits à explorer l’idée de comparer les photos des individus décédés avec les photographies de personnes recherchées par leurs proches en utilisant des technologies de reconnaissance faciale.
Cette approche a notamment été explorée dans le cadre du stage de fin d’études de Zacharie Hellouin en 2020. Son projet consistait à utiliser puis évaluer l’apport des algorithmes et des modèles de reconnaissance faciale dans l’identification des dépouilles de personnes retrouvées noyées.
Concrètement, il s’agit d’adapter et d’utiliser des modèles de machine learning, une technique d’intelligence artificielle permettant à un programme d’apprendre, en autonomie, à reconnaître des similarités et des différences sur des jeux de données. En le confrontant à des expériences répétées, comme reconnaître l’identité d’une personne, le programme s’entraîne et améliore ses résultats. Ce travail a permis de valider l’intérêt de cette technique pour la reconnaissance des disparus.
Pour la mettre en application, nous avons comparé des photos de personnes migrantes vivantes avec celles des personnes migrantes décédées dans l’espoir d’obtenir des correspondances positives. Pour cela, nous avons mis en place un index de similarité en nous appuyant sur un algorithme d’appariement qui permet d’obtenir des scores d’identité probable de la personne sous forme de pourcentages.
L’ensemble a été intégré dans une application Web destinée aux agents du CICR et à ceux légalement en charge de l’identification de dépouilles mortelles, comme les instituts médico-légaux. Cette application est en cours de développement et chacun des projets vise à l’améliorer.
Les résultats obtenus sont encourageants. Grâce à ce logiciel, nous avons pu élaborer un prototype complet de reconnaissance faciale appliquée aux migrants disparus. Cependant, pour pouvoir proposer des indicateurs réellement fiables de similarité entre des photos de personnes vivantes et décédées, il faudrait se procurer des milliers et des milliers de photos.
Ces limites étant posées, l’outil développé offre aujourd’hui aux agents du CICR la possibilité d’orienter leurs recherches en fournissant une liste de correspondances probables, rendant la recherche certes laborieuse, mais humainement possible.
Un logiciel en constante amélioration
Au début de ce projet, en 2020, il fallait rédiger un cahier des charges. Les étudiants INSA et leur enseignant Charles Dossal ont donc traduit en termes techniques les traitements automatiques ou non à effectuer sur ces images : extraire le visage du décor (un sac, le fond d’un bateau, une table…), centrer et aligner l’image, atténuer ou faire disparaître les plaies, enlever l’écume de la bouche et rendre au regard une lueur de vie.
Deux étudiants en 4e année, Adam Hamidallah et Din Triem Phan, ont ensuite programmé les algorithmes que nous avions identifiés comme les plus pertinents pour régler ces différents problèmes. Il aura fallu parfois recopier des parties de peau saine pour « panser numériquement » des plaies ou insérer des yeux issus d’un autre visage quand ceux-ci étaient trop abîmés. Les résultats sont encourageants, mais nous avons aussi pu mesurer que l’intelligence artificielle (IA) pourrait apporter des réponses plus abouties.
Au cours de l’été 2021, Zoé Philippon et Jeong Hwan Ko ont visualisé ces terribles images avec pour but de voir plus précisément ce que l’IA peut apporter dans cette mission.
L’objectif de Zoé Philippon était de tester les limites des algorithmes de reconnaissance faciale basés sur des réseaux de neurones artificiels quand on les applique à des images de visages de défunts majoritairement d’origine africaine. Ces algorithmes sont efficaces sur des images proches de celles qui ont été utilisées pour les calibrer, ici des visages de personnes vivantes, la plupart blanches et masculines, avec une faible proportion de visages féminins ou africains.
Elle a donc réalisé de nombreux tests, a ré-entrainé l’IA pour qu’elle soit plus efficace sur les images de disparus. Les résultats semblent indiquer que ces algorithmes gagneraient à être entraînés plus spécifiquement sur des visages de population plus représentative des disparus et que la reconnaissance se dégrade singulièrement quand la personne à reconnaître est décédée. Un accès à une plus grande quantité de données pourrait confirmer ces premiers résultats très encourageants.
Maquillage numérique
Jeong Hwan Ko a essayé d’améliorer les résultats de « maquillage numérique » en utilisant des réseaux de neurones artificiels préentrainés eux aussi, pour combler des trous dans des images. Ces méthodes se sont montrées redoutablement efficaces pour effacer les blessures, mais pour réparer une bouche ou des yeux, il a fallu utiliser d’autres réseaux de neurones capables d’insérer une partie d’une image dans une autre.
Pour le moment, le programmeur choisit l’image à insérer, mais à l’avenir, il sera sans doute plus efficace de laisser l’algorithme chercher lui-même dans une grande base de données, les yeux, la bouche ou les oreilles en bon état qui ressemblent le plus à celle du visage à identifier. Il reste du travail et, là encore, un accès plus large à des données permettrait sans nul doute d’améliorer la qualité de cette reconstruction faciale.
Aujourd’hui, les projets se poursuivent. Nous sommes toujours à la recherche de données pour entraîner davantage les programmes d’apprentissage automatique. Nous sommes aussi à la recherche d’entreprises mécènes disposées à partager avec nous leurs technologies, leur temps et leur soutien.
Soulignons enfin que ces mêmes applications, développées pour donner une réponse à la crise des migrants disparus, peuvent aussi servir dans d’autres contextes comme des catastrophes, des conflits ou toute situation qui peut entraîner la non-identification des personnes décédées.
Cet article a été co-écrit par Samuel Kenny, coordinateur de l'Alliance CICR-INSA.