Roland Garros : le son immersif associé à la captation UHD

Traditionnellement, Roland Garros est, pour le service Innovation de France Télévisions, l’occasion d’expérimenter les technologies du moment. Cette année, la captation UHD ainsi que la prise de son multicanale et binaurale étaient assurées intégralement avec les moyens techniques sur service public...
Tete_binaural_custom.JPG

 

L’UHD sur le terrain

Sur cette édition, les deux car-régies fabriqués en 2014 pour la filière production (sites de Toulouse et Strasbourg) câblés en 3G-SDI et, à ce titre, capables de produire en 4x3G-SDI un signal UHDp50 ont donc été mis à contribution. « Nous avons uni nos forces autour de trois expériences centrées sur de nouveaux outils de production : la captation UHD haute dynamique (HDR), la captation binaurale et la production Ultra HD en direct à l’aide des premières caméras UHD tri-CMOS lancées au NAB en avril dernier » résume Matthieu Parmentier, Coordinateur de projets R&D chez France Télévisions. « Avec ces nouveaux outils, l’objectif principal consistait à travailler l’écriture visuelle et sonore d’une production emblématique telle que Roland Garros. »

Après 12 jours de production Ultra HD en plan fixe sur le court central, le car-régie de Toulouse a retransmis en direct un signal Ultra HD produit à l’aide de trois caméras associées à une prise de son multicanale. La diffusion, UHD pour l’image et binaurale pour le son, a été effectuée sur la TNT (émetteur de Paris) et sur le satellite via le canal dédié UHD de Fransat.

Pour la partie image, le service Innovation de France télévisions éditions numériques dirigé par Bernard Fontaine a choisi de mettre en place trois caméras Grass Valley LDX-86. Ce modèle tout récent est l’un des tout premiers tri-CMOS 2/3” capable de sortir un signal Ultra HD 10 bits à 50 images/seconde sur 4 liens 3G-SDI (2160p50). Sa monture B4 offre l’avantage de pouvoir adapter des optiques TV classiques. Le signal circule sur une fibre optique standard SMPTE et rejoint une voie de traitement et de commande au car-régie tandis que la sortie 3G-SDI (1080p50) alimente le monitoring HD du car et le viseur du cadreur. L’idée était également de vérifier l’intégration d’un corps UHD avec l’ensemble des accessoires de direct existants tels que le berceau Sportscam, les remotes ou encore les liaisons CCU…

L’expérience a également mis en évidence l’importance de la qualité de l’optique sur le rendu final. Ainsi, sur les deux caméras équipées d’un zoom Fujinon, le résultat était nettement en retrait sur la caméra dotée du 88x, plus ancien, qui a exigé la mise en œuvre de la fonction CLASS (Chromatic Lens Aberration and Sharpness Solution) pour obtenir un piqué tout juste suffisant, tandis que celle équipée du 99x produisait une image de qualité et de définition sensiblement supérieure…

Notons que quelques spectateurs se sont exprimés par mail sur leur ressenti mais « cela reste pour l’instant des “VIP” au vu de la confidentialité d’accès au signal TNT et Sat » nuance Mathieu Parmentier qui souhaiterait tester d’autres caméras avant de dresser un bilan définitif : « Le modèle Sony, déjà en test sur quelques matchs de foot, sera a priori disponible à l’automne prochain. Avec ses trois vrais CMOS 4K, il surpasse sur le papier l’algorithme d’upconversion de GV qui utilise trois CMOS HD… »

 

Binaural et plan fixe

Supervisée par Lidwine Hô du service Innovations et développements de France Télévisions, les expériences audio avaient pour but de fournir un son immersif pour le RG Lab à la demande de FTV éditions numériques, mais également de mener plusieurs expérimentations dans un cadre broadcast non ouvert au public. « Pour la caméra UHD placée en fond de court diffusant le plan fixe tout au long du tournoi, une tête artificielle a été choisie de manière à reproduire le plus précisément possible l’écoute d’un match d’une personne assise à cet endroit » explique Lidwine Hô. « Malgré un placement non optimum pour le son, on pouvait parfaitement percevoir les déplacements latéraux du joueur ainsi que les éloignements. Cette écoute immersive et très réaliste reproduit également parfaitement les voix, les réactions, les émotions du public se trouvant à proximité du système de captation. Les deux capsules DPA 4060 placées sur la tête artificielle ont tout simplement été connectées et alimentées par les entrées audio de la caméra, les deux canaux étant ensuite acheminé sur les trois téléviseurs 4K du RG Lab en même temps que la vidéo. »

 

Binaural et multicam UHD

L’expérience de diffusion multicam mise en place les 5 et 6 juin consistait à tester une captation binaurale assurée par trois têtes artificielles placées sur chacune des trois caméras : 

« Les mouvements de caméra se répercutaient ainsi naturellement sur l’axe d’écoute » précise Lidwine Hô. La correspondance image/son était assurée par une commande GPI qui envoyait une impulsion à la console de mixage dès que le rouge antenne de la caméra concernée s’allumait, provocant ainsi l’ouverture du fader correspondant. « Trouver le bon temps de montée et de descente des faders n’a pas été facile sachant que le résultat dépend de nombreux paramètres comme la proximité de la caméra avec le public, l’entrain de l’audience et son placement autour du court. De plus, l’écoute binaurale qui incite à prendre le temps d’écouter ne s’accommode pas toujours de changements d’axe ou de plans rapides. Heureusement, la 4K avec sa grande définition incite également à faire des plans plus longs et des mouvements plus lents… »

 

Microphone virtuel 3D-VMS

Conçu par Angelo Farine et Leonardo Scopecce à l’Université de Parme sur une idée initiale du Centre de recherche de la RAI, le système 3D-VMS a été développé sous plusieurs formes : sphérique, cylindrique ou spiralée et de surface variable.

La version cylindrique déployée sur le Court Central est un microphone multicanal composé de 32 capsules à électret d’origine Sennheiser disposées sur un cylindre de 80 x 270 mm. En utilisant une matrice de microphones dont les signaux sont multiplexés avec une matrice de filtres, le système est capable de synthétiser jusqu’à sept microphones et donc d’effectuer des « zooms virtuels », leurs directivités et leurs directions respectives étant paramétrables en temps réel ou en postproduction grâce à une interface visuelle.

Les canaux issus de ces sept microphones virtuels, ont été mixés aux autres sons pour fabriquer le signal binaural diffusé sur la réalisation en 4K. « Comme tout système, il a certaines limites, mais sachant qu’il est encore en cours de développement, il semble tout de même très prometteur », conclut Lidwine Hô qui a pu apprécier la facilité de mise en place, de câblage et d’utilisation de l’ensemble. Le câblage de ce nouvel outil de captation capable de synthétiser jusqu’à sept microphones ne nécessite qu’un simple RJ45 cat 6, ce qui allège l’installation. Il en revanche être vigilant sur un autre point :  ce type de dispositif nécessite de nouvelles compétences comme celle liées au placement des micros virtuels qui peuvent, en outre, nécessiter un suivi durant la manifestation…