Comment les foules virtuelles ont déferlé sur Hollywood

Scène du film World War Z.

Comment les foules virtuelles ont déferlé sur Hollywood

Au volant de sa voiture, Gerry Lane est soucieux. Cet ancien employé de l’ONU est pris dans un gigantesque embouteillage qui paralyse les rues de Philadelphie. En levant les yeux, il aperçoit un hélicoptère sillonnant le ciel à basse altitude tandis que des motards de la police se faufilent, sirènes hurlantes, entre les véhicules immobiles. Mais que se passe-t-il donc ?

C’est alors qu’une foule en panique surgit de nulle part. Des centaines de personnes terrorisées courent dans tous les sens, fuyant un danger invisible. Gerry sort précipitamment de sa voiture et découvre avec stupéfaction l’origine de ce chaos : une horde de zombies vient d’envahir la ville !

Prophétie de Nostradamus ? Nouvelle vision d’apocalypse de Paco Rabanne ? Non, cette scène effrayante n’est que le récit des premières minutes de World War Z, un blockbuster américain réalisé par Marc Forster en 2013. Et Gerry Lane n’est autre que… le beau Brad Pitt en personne.

Brad Pitt joue Gerry Lane dans la première scène de World War Z. Paramount Pictures

Dans certains laboratoires de recherches comme le mien, World War Z est un cas d’école. Le film est en effet réputé pour ses remarquables « foules de synthèse » – ces animations très réalistes de paniques collectives, presque entièrement réalisées sur ordinateur. Impossible de rester insensible à ces séquences spectaculaires où s’enchaînent à toute vitesse des scènes montrant des milliers d’individus poursuivis par tout autant de zombies affamés. Difficile de croire que ce ne sont que des images de synthèse ! Et pourtant…

Figurants artificiels

L’étude du comportement des foules – que j’appelle parfois la « fouloscopie » – est une science très riche, où se croisent urbanistes, physiciens, biologistes et psychologues. Dans ce vaste champ disciplinaire, il existe une communauté de chercheurs principalement composée d’informaticiens et d’infographistes spécialisés dans les foules de synthèse. Leur mission est de concevoir des techniques d’animation permettant de générer des scènes de mouvements de foule notamment utilisées dans l’industrie du cinéma et du jeu vidéo.

Pour World War Z, par exemple, les animations ont été principalement produites à l’aide d’un logiciel nommé Massive avant d’être incrustées dans l’image filmée. Voici ce que cela donne pour la première scène du film que je décrivais précédemment : saurez-vous reconnaître le vrai du faux ?

La première scène de World War Z.

Et voici comment est faite l’incrustation :

Et oui, tout ces gens qui courent ne sont que des effets spéciaux… Paramount Pictures

Tout cela est très intéressant, me direz-vous, mais où est l’innovation ? Après tout, ce n’est là qu’une animation en trois dimensions comme nous avons l’habitude d’en voir dans n’importe quel clip publicitaire. Pas exactement…

Produire une foule de synthèse a longtemps été un véritable casse-tête pour les infographistes. Le principal problème est l’impossibilité de calculer à l’avance le comportement et la trajectoire de chaque individu dans l’animation. Étant donné le nombre important de protagonistes, cela demanderait beaucoup trop de temps et d’effort – autant recruter une armée de figurants pour faire le travail. C’est d’ailleurs la solution qui était privilégiée jusqu’au milieu des années 1980. Pour le film Gandhi réalisé par Richard Attenborough en 1983, il a par exemple fallu réquisitionner 300 000 Indiens (de vraies personnes en chair et en os) pour former la foule qui assiste aux funérailles du Mahatma ! La plupart ne furent d’ailleurs même pas payés et acceptèrent le rôle juste pour honorer la mémoire de Gandhi.

Image extraite du film Gandhi (1983) montrant une foule de 300 000 figurants humains. Ce type de scène peut être aujourd’hui généré sur ordinateur.

C’est trois ans après la sortie de Gandhi, qu’un jeune informaticien va faire une découverte majeure qui marquera l’histoire de l’infographie et du cinéma.

La révolution des « oiseau-ïdes »

En 1986, Craig Reynolds est un informaticien comme un autre. À 33 ans, il vit à Culver City, une petite ville de la banlieue de Los Angeles, et est employé à Symbolic, une entreprise américaine qui conçoit et commercialise des ordinateurs. Rien de bien étonnant, a priori.

Craig Reynolds.

Reynolds a cependant l’habitude, un brin lugubre, de partir déjeuner… dans un cimetière. Dans le calme, il aime grignoter un sandwich en contemplant le vol des merles noirs qui se regroupent par centaines autour des pierres tombales. Et à chaque repas, la même question l’obsède : comment simuler le mouvement collectif de ces oiseaux sur ordinateur ?

Cette question était à l’époque un très sérieux problème sur lequel se heurtaient les biologistes. Comment expliquer le comportement collectif des nuées d’oiseaux ou des bancs de poissons qui forment à l’unisson de somptueuses chorégraphies animales ? À chaque bouchée de son sandwich, assis au milieu des morts, Reynolds se rapprochait petit à petit de la clé de ce mystère.

Un exemple de vol d’étourneaux dans la ville de Rahat, au sud de l’Israël. Un spectacle similaire à celui que contemplait Craig Reynolds à Culver City.

Pour décrire le vol des nuées oiseaux, les scientifiques de l’époque faisaient l’erreur de chercher à identifier le leader du groupe – une sorte de chef d’orchestre qui déciderait du mouvement de tous les autres. Au contraire, Reynolds adopta la perspective inverse, et envisagea plutôt un fonctionnement complètement décentralisé, dans lequel le comportement collectif émerge à partir des interactions entre les individus, sans qu’aucun leader ne soit nécessaire. Après quelque temps, l’informaticien découvrit que trois règles comportementales très simples suffisaient :

  • L’évitement. Chaque oiseau s’éloigne de ses voisins s’ils sont trop proches de lui.

  • La cohésion. Chaque oiseau se rapproche de ses voisins s’ils sont trop éloignés de lui.

  • La cohérence. Chaque oiseau s’aligne dans la direction de vol de ses voisins s’ils sont à la bonne distance.

Et c’est tout ! Nul besoin de calculer la trajectoire de chaque individu à l’avance ni d’élire un décideur central. Si chaque oiseau s’adapte ainsi au comportement de ses proches voisins, le groupe formera, comme par magie, une étonnante diversité de comportements collectifs. Reynolds baptisa ses oiseaux artificiels des « boïds », un mot-valise issue de la contraction de « birds » et du suffixe -oïds. En français, nous parlerions d’« oiseau-ïdes ».

Une petite vidéo explicative (en anglais) du fonctionnement des boïds. Le code source du programme est librement accessible en ligne.

Voici maintenant un exemple de simulation de boïds plus récent. Une simple extension du logiciel d’animation Unity permet de réaliser ce type scène en quelques instants.

Les grandes découvertes ont ceci de particulier qu’elles franchissent immédiatement les frontières disciplinaires. Et c’est exactement ce qui se passa avec le modèle de Reynolds. Celui-ci fut présenté à la communauté scientifique en 1987 lors de la prestigieuse conférence d’infographie SIGGRAPH. Le succès fut immédiat.

Le modèle attira l’attention des ornithologues et des biologistes, qui l’utilisent encore aujourd’hui pour étudier la structure des bancs de poissons, des nuées d’oiseaux ou des troupeaux de moutons. Les travaux de Reynolds furent acclamés par les spécialistes de la vie artificielle, comme Chris Langton, ils stimulèrent la recherche sur le comportement des foules, et ils permirent de nombreuses découvertes en physique des systèmes émergents. Sa publication scientifique cumule aujourd’hui une dizaine de milliers de citations. C’est énorme ! Et bien sûr, pour revenir au sujet qui nous intéresse aujourd’hui, les infographistes y virent immédiatement une technique d’animation prometteuse pour le cinéma.

Dès lors, Craig Reynolds devient une figure incontournable des studios hollywoodiens. Il est embauché en 1992 par Electronic Arts et participe à la réalisation des effets spéciaux de nombreux films de l’époque.

L’attaque des Gallimimus dans Jurassic Park en 1993 : signé Craig Reynolds.

La nuée de chauve souris dans Batman Returns en 1992 : encore Craig Reynolds

Le troupeau de buffles dans Le Roi Lion en 1994 : toujours Craig Reynolds.

L’après Reynolds

Les individus qui constituent les foules de synthèse sont aujourd’hui dotés d’une intelligence artificielle plus en plus élaborés, leur permettant de réagirent à leur environnement de manière autonome, sans qu’il ne soit nécessaire de définir leur comportement à l’avance.

Ainsi, les piétons de synthèse de World War Z décident « tout seuls » dans quelle direction ils vont fuir. Les réalisateurs du film se contentent simplement de définir la dynamique globale de la foule. Et pour animer une horde de zombies ? C’est le même principe. Les morts-vivants ont des « personnalités » différentes, des tailles différentes, des stratégies différentes… et aucun infographiste ne sait à l’avance ce qu’ils vont faire pendant l’animation. Seule certitude : ils sont tous soumis aux lois de la physique (ils tombent dans le vide ou se cognent les uns contre les autres), obéissent à quelques règles comportementales (comme les lois de Reynolds), et sont, bien sûr, attirés par l’odeur de la chair fraîche.

Voici un petit aperçu du making-of de ces scènes dans World War Z réalisées par le studio d'effets spéciaux britannique MPC :

Il n’y a pour ainsi dire plus aucune autre limite que l’imagination du réalisateur. Voici par exemple une foule de synthèse en train de se faire balayer par une hélice géante (construite par le logiciel Miarmy) :

Ou encore une foule de cyclistes prit dans un méga carambolage (construite par le logiciel 3DS Max) :

Massive, le logiciel utilisé pour World War Z, a d’ailleurs été conçu il y a quelques années pour les besoins d’une autre superproduction hollywoodienne : Le seigneur des anneaux. Pour ce film, le défi était d’animer d’épiques batailles impliquant des dizaines de milliers de soldats ou de créatures fantastiques. Ici une démonstration de ce que peut faire le logiciel dans ce domaine.

Cela vous fait envie ? Pour calmer vos ardeurs d’infographiste en herbe, sachez que la version complète de Massive coûte 16 000 dollars et il vous faudra quelques semaines de formation avant de réussir à produire trois piétons qui attendent le bus…

L’infographie rejoint la fouloscopie

De la même façon que Reynolds a révolutionné l’infographie en observant le monde réel, les infographistes d’aujourd’hui n’hésitent plus à conduire de vraies expériences en laboratoire pour améliorer le réalisme de leurs animations. La méthode consiste à rassembler des dizaines de participants dans une arène expérimentale afin d’analyser leur déplacement collectif, comme nous l’avons fait en 2012 avec des informaticiens de l’INRIA de Rennes. Ces expériences permettent de mieux comprendre le comportement des foules et d’améliorer le réalisme des techniques d’animation existantes.

À cette occasion, j’ai par exemple fait la connaissance de Stéphane Donikian, un chercheur « foulologue » qui a depuis créé son propre logiciel d’animation, Golaem, aujourd’hui en concurrence avec Massive. Et sa petite entreprise rennaise ne connaît pas la crise ! Golaem a participé à la conception des foules de synthèse dans Game of Thrones, et dans Astérix et Obélix en 2013 dont voici une vidéo de présentation :

Et tout cela grâce à un informaticien qui mangeait un sandwich dans un cimetière… Thank you, Craig !

Make a donation right now and it will be doubled by the NewsMatch Challenge!