Du 15 au 26 mars 2023 se sont déroulés les championnats du monde féminin de boxe anglaise à New Delhi en Inde, et les championnats masculins se dérouleront du 1er au 14 mai 2023 à Tashkent en Ouzbékistan.
Un combat de boxe amateur se déroule sur un ring carré pendant 3 rounds de 3 minutes chacun avec 1 minute de récupération entre chaque round. Le vainqueur du combat est désigné par le vote de 3 à 5 juges situés autour du ring qui évaluent le nombre de coups de qualité sur la cible, la domination par supériorité technico-tactique et la compétitivité (exprimée par l’activité et l’engagement).
Dès lors, les athlètes doivent être capables de contrôler l’espace sur le ring, gérer le temps, imposer un rythme à leur adversaire, proposer un style de boxe varié, offensif et agressif, créer de l’incertitude, et proposer des moyens de défense.
A la fin de chaque round, les juges évaluent les deux boxeurs avec une note allant de 7 à 10 en se basant sur les critères de jugement évoqués. Avec le projet PerfAnalytics, nous accompagnons la Fédération Française de Boxe qui souhaite objectiver l’évaluation de la production des boxeurs au cours des combats. La démarche consiste à collecter des données en entraînement et en compétition pour numériser et analyser les déterminants de la performance, identifier des caractéristiques individuelles afin de proposer des clefs d’adaptations spécifiques à la concurrence, aux différentes catégories de poids, aux forces et faiblesses révélées des athlètes français.
C’est dans ce contexte que la Fédération nous a invités à déployer un système de captation inédit sur le tournoi de présélection équipe de France 2024 en février dernier. Ce système, composé de caméras synchronisées avec des accéléromètres fixés aux poignets des athlètes, a permis de quantifier le nombre de percussions produites et subies, et les positions et déplacements des deux athlètes au cours des combats.
Détecter automatiquement les coups portés
Enregistrer des vidéos de combats pendant les entraînements ou lors des compétitions permet de les traiter ultérieurement et de les utiliser comme support afin de discuter d’aspects techniques avec les athlètes. Cela permet de revenir sur des moments précis du combat, d’analyser les techniques employées et d’identifier les points à améliorer pour renforcer les performances des athlètes.
Par extension, visualiser avec précaution ces vidéos et compter manuellement l’ensemble des percussions permet de fournir une première objectivation de la performance, mais reste une tâche ardue et longue quand elle est faite par les analystes vidéo. Lors du tournoi de présélection, nous avons observé pour des catégories de poids différentes en moyenne 489 coups échangés par combat, avec 55 coups par minute.
Des méthodes automatiques issues d’algorithmes de vision par ordinateur peuvent être envisagées pour alléger la tâche des analystes afin d’identifier les coups par la reconnaissance de la posture et des mains des athlètes. Cependant, utilisées seules, ces méthodes amènent très souvent à la production de faux-positifs et faux-négatifs, qui correspondent soit à des actions mal identifiées comme étant des coups, ou au contraire à un manque de détection des véritables coups.
Aussi, pour garantir la précision d’une détection automatique et rapide des coups durant la compétition officielle, les membres de la fédération ont installé des capteurs par centrale inertielle aux poignets des combattants pour toutes les rencontres. Les centrales inertielles permettent de mesurer en 3D l’accélération linéaire et angulaire à des cadences atteignant le centième de seconde.
Ces capteurs ont été synchronisés à l’image près avec des caméras vidéo qui filmaient le ring sous différents angles pour identifier les moments précis correspondant aux coups portés.
Au total, sur plus de 3 millions d’images captées, 21 474 séquences ont pu ainsi être isolées automatiquement sur 31 matchs.
Caractériser les coups manuellement nécessite des ressources humaines importantes
Isoler automatiquement tous les coups d’une compétition permet de quantifier les performances des athlètes et de calculer la cadence des coups portés, ce qui donne une mesure générale de la dynamique de chaque round. En revanche, il arrive que des erreurs d’identification apparaissent, l’accélération et l’orientation mesurées de l’avant-bras ne discriminant pas totalement les coups réels des mouvements de garde ou de décontraction musculaire.
De plus, isoler les coups ne permet pas de caractériser quel type de coup est effectué (crochet ou direct par exemple), et de savoir, par exemple, quels enchaînements ont été efficaces face à certains·e·s adversaires.
Caractériser ces coups demande de visualiser chacun d’entre eux pour les analyser précisément et les classer dans des catégories décidées à l’avance. Dans ce but, nous avons développé un outil optimisé de visualisation et annotation permettant de rejouer une courte séquence animée indiquant si le coup détecté est valide, et, si c’est le cas, quelle était la cible de celui-ci ainsi que le résultat : touché, manqué ou bloqué. Grâce à cet outil, des analystes de la Fédaration Française de Boxe ont pu caractériser au total 16086 coups en excluant environ un quart des coups totaux (mauvaises détections) cela leur a pris environ 37h.
Estimer automatiquement la position des boxeurs sur le ring
Les méthodes issues de l’analyse vidéo automatique continuent d’offrir des perspectives intéressantes d’extraction d’information sur le déroulement du combat et la performance des boxeurs.
En combinant les vues de plusieurs caméras fixes, il est possible de calculer la localisation 3D des centres articulaires (genoux ou chevilles) détectés dans l’image. Mais, comme évoquée, la fiabilité des systèmes de reconnaissance automatique de la posture humaine n’est pas encore adaptée aux conditions réelles de la compétition. Plus simplement, il est aussi possible de n’utiliser qu’une seule caméra dès lors qu’un objet plan est identifié dans la scène comme le carré du ring par exemple. Dans ce cas, l’information extractible est alors réduite à ce plan, mais continue de permettre d’envisager des métriques utiles comme la position relative des boxeurs ou la distance parcourue par chacun d’eux. Cette approche “monoculaire” permet d’aborder des méthodes plus robustes et fournir des résultats plus rapidement. On peut alors se satisfaire du flux vidéo lié à la diffusion des matchs en direct bien que les changements de caméras et mouvements du cadrage (zooms et déplacements) continuent de rendre la tâche d’analyse automatique complexe.
Il existe donc un compromis à observer entre analyse fine, fiabilité et disponibilité des données traitées. Nous avons donc dans un premier temps effectué les analyses dans un cadre monoculaire afin de respecter les délais restreints attendus par la fédération et garantir un niveau de fiabilité.
À partir des centres articulaires approximatifs estimés pour chaque boxeur par la méthode choisie de reconnaissance automatique de la posture humaine (OpenPose, CMU), nous ne retenons que les chevilles. En les assimilant à leur projection sur le sol, le centre des deux chevilles est calculé à chaque image, délivrant une position unique pour chaque boxeur sur le ring.
On remarque sur cette figure, que le boxeur bleu est resté majoritairement au centre du ring et que son adversaire coin rouge lui s’est déplacé dans une zone plus large autour de lui. Sur ce round le combat s’est déroulé majoritairement au centre et très peu dans les cordes.
Utilité des données capturées : analyse en profondeur pour l’identification de nouveaux indices de la performance
C’est la première fois que la Fédération Française de Boxe a entrepris une expérimentation de cette ampleur durant une compétition de niveau élite, hors d’un environnement limité en laboratoire. Au-delà des premiers résultats et rapports fournis aux staffs techniques, la constitution d’un jeu de données vidéos annotées est une contribution précieuse.
La richesse des informations collectées in situ permet de mieux caractériser la réalisation des performances et d’évaluer les mécanismes de concurrence.
Il est par exemple possible de produire des rapports de combat (Figure 5) qui peuvent aider à analyser une performance. Le but est d’identifier le rapport de force qui oscille sous l’effet des actions simultanées des adversaires. La question est d’identifier les facteurs et événements qui se conjuguent en phénomènes ou mécanismes associés à l’issue finale (victoire ou défaite). Une meilleure compréhension des contextes de charge compétitive permettra aussi de mieux adapter les charges d’entraînement et de préciser l’importance des temps de récupération. En combinant différentes sources (biomécanique, contraintes, milieux, etc.), nous établirons de nouveaux déterminants, physiques et physiologiques, du risque et de la performance.
Une des prochaines perspectives à terme est l’utilisation de ces informations collectées pour l’entraînement d’algorithmes de détection et caractérisation automatique des coups à partir de flux vidéos uniquement afin d’aboutir à une solution sans aucun capteur qui soit robuste et fiable même en compétition.
Les auteurs souhaitent remercier la Fédération Française de Boxe et particulièrement les membres de sa Cellule Performance : Lionel Brézéphin, Chloé Lesenne, Gauthier Rispal, ainsi que Pierre Leroy (Inria) et Alexandre Schortgen (Irmes/Inria).
Le projet Analyse in situ de la performance est soutenu par l’Agence nationale de la recherche (ANR), qui finance en France la recherche sur projets. Elle a pour mission de soutenir et de promouvoir le développement de recherches fondamentales et finalisées dans toutes les disciplines, et de renforcer le dialogue entre science et société. Pour en savoir plus, consultez le site de l’ANR.