Suite à la sortie, ce mois-ci, des Aventures de Tintin par Steven Spielberg et Peter Jackson, intéressons-nous à cette nouvelle technologie qu’est la Performance Capture. Technologie, rappelons-le, qui, complétant la Motion Capture, permet de reproduire au mieux la « performance » d’un acteur réel sur son avatar numérique et ainsi de gagner en crédibilité et en réalisme avec des personnages entièrement virtuels.
Petit rappel historique…
A l’heure où la « révolution » Avatar est passée, il est utile de remonter quelques années en arrière et de rappeler l’émergence de la Performance Capture. Revenons à la base, c’est-à-dire l’animation.
L’animation traditionnelle, appelée aussi 2D, est logiquement conçue sans acteur ; c’est l’animateur qui donne vie à ses personnages, suivi par le doubleur qui va leur donner une voix. Ainsi, l’animateur peut être considéré comme un acteur qui doit comprendre les émotions et la psychologie de ses personnages afin de les retranscrire sur celluloïd. Il joue, d’ailleurs, souvent lui-même les scènes pour en comprendre mieux les mécaniques. Néanmoins, il serait absurde de penser que l’animateur crée tout à partir de rien. Il s’appuie sur deux techniques afin de rendre plus réalistes ses animations : la rotoscopie et la prise de vue réelles.
La première technique est basée sur un décalquage image par image d’une séquence réelle et la seconde sur l’enregistrement de la scène, jouée par des acteurs, souvent accompagnée d’une grande grille en arrière-plan pour que l’animateur reproduise de façon plus simple les mouvements.
Puis l’arrivée des ordinateurs et de l’animation 3D a commencé à changer la donne. Les personnages numériques se rapprochant de plus en plus des vrais êtres humains, il devenait paradoxalement plus difficile de rendre les personnages réalistes, c’est ce qu’on appelle le phénomène de la vallée dérangeante. En effet, plus l’avatar s’approche de l’humain, plus celui-ci en détecte les infimes différences et un malaise se crée chez lui. La même chosei se produit avec les robots humanoïdes actuels qui provoquent du rejet et de la peur chez les vrais êtres humains. Il y a deux solutions possibles pour contrer ce problème : soit styliser les personnages (solution adoptée par les studios Pixar ou Dreamworks) soit pousser la barrière du réalisme de plus en plus loin.
|
Pour se faire, la technique la plus répandue à l’heure actuelle, utilisée aussi bien au cinéma que dans le secteur du jeu vidéo, est celle de la motion capture (mocap en anglais). Vêtu d’une combinaison bardée de capteurs, l’acteur joue réellement la scène et ses mouvements sont analysés et enregistrés pour être transmis à un double virtuel qui reproduit alors les mouvements réels. Le film qui a changé la donne : les Deux Tours de Peter Jackson (2002). En effet, le deuxième volet du Seigneur des Anneaux mettait en scène le mythique personnage de Gollum. Pour la première fois, un personnage entièrement virtuel jouait et interagissait avec les autres protagonistes d’une manière incroyablement réaliste. L’impression de se retrouver face à un personnage fait de polygones disparaissait petit à petit. |
Etapes de création de Gollum pour les Deux Tours
|
Mais il restait encore quelques détails à peaufiner sur cette technique et c’est alors que James Cameron (Terminator, Titanic…), impressionné par la créature de Weta Digital, décide de réaliser un projet de longue date…
Techniquement et concrètement, qu’est-ce que ça change ?
Si Gollum a convaincu Cameron qu’un personnage virtuel pouvait désormais être crédible, il reste encore une étape à franchir.
La partie du corps humain la plus difficile à reproduire est le visage avec sa multitude d’expressions. Jusque-là, un des défauts majeurs des personnages 3D à vocation réaliste était leur possible inexpressivité. Les personnages de Neo ou de l’Agent Smith dans Matrix en est un parfait exemple (quoique…). C’est pourquoi diverses techniques ont été essayées afin d’améliorer le réalisme des expressions faciales. Plus couramment, c’était l’emploi de mini capteurs collés sur le visage aux endroits stratégiques qui était la solution la plus appropriée.
Pour Avatar, James Cameron décide d’employer la nouvelle technologie Performance Capture développée par Robert Zemeckis pour le Pôle Express et Beowulf. Il s’agit alors pour les équipes d’effets spéciaux de perfectionner la technique et de la démocratiser.
En quoi consiste la différence entre la motion capture et la performance capture ?
La Performance Capture reprend la combinaison avec les capteurs mais rajoute un élément : un casque muni d’une caméra qui filme en permanence le visage de l’acteur. Ici, plus de capteur sur le visage mais des simples points de couleur. La caméra enregistre les mouvements du visage grâce à ces points et le logiciel de post-production retraite ces informations pour animer, de la même manière, le personnage virtuel. C’est aussi simple que ça. Enfin, on se comprend…
Il existe des variantes de cette technique comme le motion scan qui, comme son nom l’indique, scanne le visage de l’acteur au lieu d’analyser les mouvements. C’est la technique utilisée pour le jeu L.A. Noire sorti cette année.
Du visage réel au visage virtuel
Bien entendu, l’implantation et la réalisation d’un tel système ne s’effectue pas dans les mêmes conditions qu’un film en prise de vues réelles. Ici, tout se tourne en studio, dans un local bourré de capteurs qui a été baptisé « le Volume ». Pas de fond vert ou quoi que ce soit ici puisque l’on ne filme pas pour incruster ensuite, on enregistre uniquement le jeu de l’acteur. L’acteur n’est, évidemment, pas lâché dans une salle vide. Les éléments avec lequel il interagit sont recrées : table, passerelle, animal volant. Ces éléments ne sont pas reconstruis fidèlement, il s’agit juste qu’ils aient la même forme et la même configuration.


Sur le tournage d’Avatar. A droite, Zoë Saldana/Neytiri chevauchent leurs « montures »
Ainsi, l’expérience n’est pas si singulière pour l’acteur lequel, malgré les capteurs, ne se sent pas spécialement restreint dans son interprétation. Beaucoup disent que jouer en Performance Capture s’apparente à jouer au théâtre : il y a peu de décors, tout se joue au même endroit et dans ce cas, dans une certaine intimité. C’est grâce à son imagination et son expérience personnelle que l’acteur reconstruit son environnement. Pour le tournage d’Avatar, Cameron avait amené ses acteurs quelques jours dans la jungle afin qu’ils s’approprient les lieux et qu’ils puissent puiser dans leurs souvenirs lorsqu’ils ont tourné par la suite dans le Volume.
De même, l’absence d’un tournage avec des caméras traditionnelles permet au réalisateur de rester au plus proche de l’action et de ses acteurs. L’échange entre le metteur-en-scène et ses comédiens est donc plus intime.
|
Spielberg employant la caméra |
Cependant, il ne faut pas penser que les caméras ne sont plus utilisées dans ce genre de réalisation. Des caméras vidéo classiques sont utilisées comme témoins pour aider sur différents postes : le montage, la reproduction du plan virtuel et même l’animation faciale des avatars. C'est surtout une caméra spéciale, développée pour l’occasion, qui est employée. Elle est elle-même équipée de capteurs afin de la repérer dans l’espace et de faciliter en post-prod la mise-en-place de(s) la caméra(s) virtuelle(s), selon le découpage voulue par le réalisateur. En effet, cette caméra, dépourvue d'objectif, offre la possibilité grâce à ses capteurs de visualiser en temps réel un pré-rendu de la scène finale. En effet, pour que le réalisateur puisse avoir un aperçu de ce à quoi va ressembler le plan final, l’écran de cette caméra affiche le décor et les personnages virtuels de la scène. C’est pour cette raison que c’est souvent le réalisateur qui filme lui-même. Evidement les modélisations et les textures restent basiques afin de permettre une visualisation en temps réel mais l’ensemble est suffisamment détaillé pour avoir une idée précise du rendu final. Travailler de cette manière nécessite une phase de pré-production plus importante puisqu’il faut penser les décors, le design des personnages et réaliser leurs modélisations avant le tournage.
|
|
La Performance Capture permet ainsi de recréer des êtres humains réalistes mais pas seulement. Elle peut être employée également pour recréer des animaux, proches de l’Homme dans leur physionomie, tels que les singes. Weta Digital s’était déjà essayé à l’animation des primates pour le remake de King Kong (2005) du même Jackson. Andy Serkis, qui avait interprété Gollum, s’était alors glissé dans la peau du Roi de l’Ile du Crâne. Pour le récent la Planète des Singes, les origines, Weta Digital ont utilisé la Performance Capture pour animer les singes plutôt que d’employer des hommes en costumes, méthode employée jusque-là dans la franchise. Néanmoins, une telle technique exige de l’acteur d’apprendre à imiter avec réalisme le comportement d’un singe. C’est pourquoi Andy Serkis, qui a joué Kong et Caesar dans les deux films, a étudié avec minutie la vie des singes et est même allé jusqu’à partir au Rwanda pour côtoyer des singes en liberté. |
Andy Serkis aime jouer les primates... |
On remarquera qu’Andy Serkis est une certaine figure de cette méthode d’animation puisqu’après s’être glissé dans la peau de Gollum, King Kong puis Caesar, c’est lui que Spielberg a choisi pour interpréter le Capitaine Haddock dans le film Tintin…
Bientôt sur nos écrans
Néanmoins, il serait inexacte de penser que la Performance Capture ne sert qu’à amplifier le réalisme de scènes au traitement photo-réaliste, cette technique peut être également employée dans un film au style plus « cartoon ». L’exemple le plus flagrant est certainement la nouvelle réalisation/production de Steven Spielberg et Peter Jackson, Les Aventures de Tintin – Le Secret de la Licorne, qui sort en salles en France le 26 de ce mois.
|
Sur le plateau, baptisé "le Volume", lors du tournage de Tintin |
Dans un souci de respect de l’œuvre originale d’Hergé, Spielberg a abandonné son idée de longue date de faire son film Tintin en prise de vues réelles. C’est pourquoi il a choisi de le réaliser en tant que film d’animation 3D avec l’utilisation de la Performance Capture. Ainsi, visuellement il peut garder le style graphique de la bande-dessinée belge (aplats colorés…) mais aussi la ligne claire chère à Hergé. Egalement, les personnages sont restés fidèles à leurs versions crayonnées tout en ayant un design plus réalistes (pores de la peau, muscles…). |
Mais également, ce choix de réalisation a également libéré les metteurs-en-scène de la contrainte physique. En effet, dans un film en prises de vues réelles, il aurait fallu rechercher des acteurs qui ressemblent à leurs homologues de papier, au détriment peut être de meilleurs interprètes. Ici, le physique des personnages étant entièrement recrée par ordinateur, Spielberg et Jackson ont pu choisir les acteurs qui incarnaient le mieux « psychologiquement» les divers protagonistes de l’histoire.
Il ne s’agit absolument pas de la même approche qu’Avatar, puisqu’ici il s’agit effectivement d’un film d’animation, tandis qu’Avatar mélangeait les personnages numériques avec la prise de vues réelles.
Nous saurons très bientôt s’ils ont réussi leur pari…
De la BD au film...
En attendant, d’autres films utilisant la Performance Capture se préparent. Peter Jackson (encore lui) s’attèle à la réalisation de Bilbo le Hobbit, la préquelle du Seigneur des Anneaux dont la première partie sortira le 12 décembre 2012. Beaucoup de scènes sont déjà tournées et Andy Serkis a pu enfiler sa nouvelle tenue pour réinterpréter Gollum, le rôle qui l’aura fait connaître : la boucle est bouclée.
Enfin, les Na’vis seront également de retour sur grand écran, James Cameron se préparant pour Avatar 2 et 3. Il faudra encore attendre le deuxième volet prévu pour 2014. Mais le temps et la technologie passent vite désormais…
La Performance Capture, associée au Motion Capture, est donc bien l’aboutissement actuel d’une recherche de près d’un siècle pour rajouter du réalisme dans des scènes animées. De Walt Disney, qui donnait une grande importance à la notion de poids dans le dessin, aux logiciels qui traitent les expressions faciales humaines, cette « révolution » digitale tient plus de l’évolution.
Néanmoins, pour terminer cet article, il faut nuancer les propos tenus jusque-là. Si la Performance Capture est un outil formidable, elle ne peut pas être utilisée « brut de pomme ». L’animateur 3D doit toujours corriger les animations ainsi crées. Il y a en effet toujours une différence entre le réalisme de la réalité et le réalisme virtuel. Souvent, l’animateur 3D doit exagérer les mouvements dans l’animation pour qu’ils nous paraissent plus crédibles. Dans l’animation traditionnelle, le même problème se pose. Il provient du fait que, dans la réalité, notre œil et notre cerveau enregistrent beaucoup plus d’informations que l’on ne pense (notamment la notion de poids et de pesanteur justement). Ainsi, la même scène, filmée, décalquée en 2D, reproduite en 3D, nous paraîtra bizarre en animation alors qu’elle nous semblera toute naturelle en prises de vues réelles.
C’est pourquoi, aujourd’hui encore, il reste encore beaucoup de progrès à faire si l’objectif est de reproduire la vie à l’écran. Mais on n’arrête pas le progrès !…
A très bientôt, mon précieux... (Bilbo le Hobbit)
Edouard Weitzel-Couvin
