Quel est le problème ?
Aujourd’hui, une fois la version principale d’un produit achevée – montage, effets, mixage, étalonnage terminés – commence un travail de déclinaison des versions qui est loin d’être anecdotique. Car il faut faire un master différent selon chaque type de diffusion (TNT, IPTV, VàD, DVD, Blu-ray…), selon la langue (pour le son et pour les sous-titres), le ratio d’image (4/3, 16/9, et les ratios film à inclure dans les précédents), la cadence (25 i/s et 29,97 i/s parfois à tirer d’un 24 i/s), la résolution (SD, HD…), le balayage (entrelacé ou progressif), le codec réclamé (MPEG-2, MPEG-4…), mais peut-être aussi aura-t-on différentes versions du montage, longue et courte, censurée ou non – et l’on ne parle ici que de ce qui est destiné au petit écran. La moindre modification peut devenir très pénible à gérer. Enfin, la perspective de devoir rouvrir ces éléments dans plusieurs années, quand tous les formats auront changé, est, à juste titre, assez angoissante!
Les actuels masters en fichier, au format MXF (Material eXchange Format) OP1a dit « aplati » (flattened), ne contiennent qu’une version, et obligent donc à faire un master pour chacune d’entre elles, comme en cassette. Le but est donc de simplifier cette gestion avec un format pivot qui facilite les déclinaisons et les échanges.
La démarche
De la même façon que le DCI (Digital Cinema Initiative) s’était constitué pour standardiser le cinéma numérique, six majors hollywoodiennes (20th Century Fox, Sony Pictures Entertainment, Warner Bros, Paramount, Walt Disney, Universal) ont constitué l’IMF (Interoperable Master Format) dès 2007 afin de trouver un standard pour l’échange des masters dématérialisés. Le premier nom retenu pour les masters fut DVP (Digital Video Package), ce qui montre bien l’intention de s’inspirer du DCP (Digital Cinema Package) en traitant les besoins propres à la vidéo.
L’IMF propose un format de master qui contient l’image et le son en qualité finale, les sous-titres, différentes métadonnées techniques, des listes de lecture pour générer éventuellement différentes versions, et des listes de sortie pour produire différents PAD (Prêt À Diffuser). On ne stocke que ce qui est commun, plus les informations nécessaires à la reconstruction des autres versions.
On livrera le même master à tous les clients, et chacun pourra exploiter la version qui l’intéresse pour sa diffusion, quels que soient les supports de visualisation (télévisions, ordinateurs, smartphones, tablettes…).
Un master IMF s’appelle un IMP (Interoperable Master Package). De la même façon que le DCI a défini les règles qui permettent de produire des DCP, l’IMF définit les IMP. Le mot package est difficilement traduisible (paquet, ensemble, conditionnement, certains voudraient reprendre le terme de copie – print en anglais). Concrètement, il ne s’agit pas d’un fichier, mais d’un dossier contenant plusieurs fichiers.
Il y a une différence d’usage entre le DCP et l’IMP : un DCP sort d’un prestataire (laboratoire) et va chez l’utilisateur final, la salle de cinéma ; tandis qu’un IMP, qui sort aussi d’un prestataire, va chez un autre professionnel, le diffuseur, qui va l’utiliser pour générer le fichier PAD qui sera diffusé. L’IMP n’est pas destiné aux consommateurs, et c’est pourquoi on parle de « B2B » (Business To Business).
Les briques de l’IMF
L’IMF est construit autour d’un coeur (Core) qui définit la base de son fonctionnement.
Mais évidemment, on sait déjà que de nouveaux codecs, de nouveaux formats vont apparaître dans le futur. L’IMF a donc prévu, pour adapter ce coeur à des formats particuliers, des Applications. Le mot ne désigne pas un programme informatique, mais une brique complémentaire dans les spécifications de l’IMF, qui lui permet de développer des variantes dédiées à des besoins spécifiques, d’évoluer tout en restant compatible avec lui-même. On aurait pu parler de « Plug-In ».
Actuellement, il existe une Application 1, encore théorique, qui utilise des images non compressées, en DPX ou Open EXR, 4K et 16 bits maximum ; l’Application 2, qui est candidate à devenir un standard, utilise le JPEG 2000, en HD et 10 bits maximum ; l’Application 3 est en MPEG-4 Part 2, le codec utilisé pour les HDCam SR, en 4K et 12 bits maximum. D’autres applications avec des résolutions plus élevées (8K) ou d’autres codecs (HEVC intra) pourront être développées dans le futur.
Néanmoins, nombreux sont ceux qui souhaitent qu’on ne mette dans le standard IMF que des codecs non propriétaires. On y trouvera donc le MPEG-2, MPEG-4, JPEG 2000, etc., mais pas le ProRes par exemple.
Que trouve-t-on dans un IMP ? Évidemment les essences, terme qui, dans le jargon MXF, désigne tout ce qui est perceptible (image, son, texte…), mais aussi différents fichiers comme des listes de lecture, des listes de sortie, et quelques autres.
Les essences
Les essences sont encapsulées dans un format MXF existant, l’AS-02 (Application Specification 02).
L’AS-02 est une variante « contrainte » de MXF, c’est-à-dire conçue pour des besoins spécifiques, ceux des gens de vidéo. Il a été développé par l’AMWA (Advanced Media Workflow Association), issue en 2000 de l’AAF (Advanced Authoring Format), dont le but est une meilleure utilisation du MXF. Indépendamment de l’IMF, l’AS-02 est déjà utilisé par Avid, Apple, et différents serveurs de postproduction.
On parle cette fois de bundle (paquet), mais concrètement il s’agit toujours d’un dossier, lequel contient un sous-dossier Media avec toutes les essences. Elles sont chacune encapsulées dans un fichier séparé en MXF OP1a.
Il existe aussi quelques fichiers spécifiques, dont le shim (cale) écrit en XML. Comme les cales qui servent à remplir de petits espaces entre les objets pour un meilleur ajustement, les shims sont de petits bouts de spécifications conçus pour remplir l’intervalle entre une spécification générale du standard et l’utilisation locale de celui-ci chez un utilisateur. Il restreint l’ensemble des possibilités de la norme AS-02 à une utilisation particulière. Un shim permet par exemple de définir une fréquence audio ou une résolution spécifique, SD, HD, pour le Web…
L’AS-02 peut aussi contenir, dans un sous-dossier Extra, des notes de production ou des rapports qualité au format Word.
Les CPL
Un IMP est donc, en quelque sorte, un AS-02 auquel on a adjoint des éléments supplémentaires, parmi lesquels des CPL (Composition Play List ou listes de lecture).
Les CPL, comme dans un DCP, sont des fichiers XML qui définissent ce qui doit être lu. Elles permettent de produire d’un même ensemble de médias plusieurs versions différentes, et donnent à l’IMF sa flexibilité. Par exemple, un IMP peut contenir des médias en version française et allemande, pour le son comme pour les sous-titres, et deux CPL, une qui utilisera les médias français, l’autre les médias allemands.
Elles utilisent des UUID (Universally Unique Identification) qui désignent les fichiers de manière absolue, sans se référer au chemin du fichier.
Les OPL
Un IMP contient aussi une ou plusieurs OPL (Output Profile List), également écrites en XML, qui mémorisent différentes combinaisons de transcodage pour obtenir du master général un PAD adapté à un type de diffusion particulier.
À partir d’une CPL choisie, elles donnent l’ordre d’appliquer certains paramètres – de résolution, de quantification, de ratio, de sous-échantillonnage (4:2:2, 4:2:0…), de cadence, de codec, de débit, de mode CBR ou VBR, mais aussi, grâce à une LUT, de conversion d’espace colorimétrique. Par exemple, on prend une image en RVB 4:4:4 10 bits pour en faire une sortie en 4:2:2 8 bits ; ou l’on transforme un film 4K pour qu’il puisse être vu sur un iPad ; ou l’on définit comment passer un son multicanal en stéréo.
Plusieurs OPL peuvent traiter la même CPL en lui appliquant des paramètres différents ; une même OPL peut être appliquée à plusieurs CPL. En revanche, une OPL prend la CPL de façon globale, elle ne permet pas de faire une nouvelle version du programme – ce sont les différentes CPL qui ont cette fonction.
Naturellement, ce n’est pas l’OPL elle-même qui transcode, mais elle s’interface avec les équipements périphériques pour leur transmettre leurs instructions.
Les métadonnées
L’IMP contient aussi des métadonnées descriptives dynamiques, c’est-à-dire qui changent régulièrement, à chaque plan (comme des corrections colorimétriques) ou à chaque image (comme le timecode). On peut y trouver des informations concernant le relief, le recadrage (pan and scan), et même les déformations anamorphiques. Ainsi, la déclinaison d’un programme dans un autre ratio (par exemple de 2,39 en 1,33) peut être préalablement mémorisée et se reproduire automatiquement.
Les autres fichiers
Il existe aussi dans un IMP des fichiers de service, au format XML, l’Asset Map et la PKL (Packing List ou Packaging List).
L’Asset Map est la carte qui décrit la répartition physique des fichiers sur le support utilisé pour le transport. Elle donne la relation entre le nom de la CPL, son UUID, les UUID des essences, et la PKL. C’est l’équivalent du bon de livraison qui liste tout ce qui se trouve dans le carton qu’apporte un livreur. Elle sert lors des acquisitions à vérifier que l’IMP est cohérent.
La PKL liste tous les fichiers individuels compris dans l’IMP. Elle garde le nom des CPL et des UUID des essences associées.
Un exemple d’utilisation
Le distributeur d’une société américaine prépare un master pour les chaînes de télévision françaises. Il utilise un logiciel de création de master IMF, et met à l’intérieur d’un IMP Application 2, par exemple, l’image en HD, recadrée de 2,39 en 16/9, 24 i/s, JPEG 2000, et le son en PCM 5.1. Pour l’adaptation française, il prévoit des sous-titres et le doublage audio, mais comme cette adaptation est bien faite et que les génériques de début et de fin ont aussi été traduits, il met encore deux petits médias image supplémentaires.
Il définit deux CPL, l’une qu’on appellera « Version Originale » et l’autre « Version Française ». La CPL VO lira l’image et le son originaux, plus les sous-titres français. La CPL VF sera plus complexe : pour l’image, elle lira d’abord le générique de début français, puis elle basculera sur l’image originale après générique, pour revenir sur le générique de fin français ; pour le son, elle lira seulement le doublage et, évidemment, elle ignorera les sous-titres.
Pour les OPL, on peut en imaginer plusieurs, la plus simple étant celle qui dit seulement « lit tel quel ». Auquel cas, quelle que soit la CPL choisie, on obtiendra une image à la résolution originale, en HD et en JPEG 2000, et un son PCM en 5.1. Mais cette version ne servira guère à un diffuseur.
Une autre OPL en revanche, qu’on appellera « French TV », commanderait par exemple une résolution SD, 4:2:2, 8 bits, avec recadrage du 16/9 en4/3, 25 i/s, MPEG-2, et le son en stéréo…
Le diffuseur reçoit l’IMP – qui contient donc outre les essences anglaises et françaises, les CPL et OPL décrites –, et le rentre dans son serveur compatible IMF. Il choisit d’une part une CPL, par exemple la VF, d’autre part une OPL, par exemple la French TV. Les instructions contenues dans l’OPL accélèrent d’une part la lecture de 24 à 25 i/s, et d’autre part sont acheminées, via un protocole FIMS (Framework for Interoperability of Media Services), aux équipements de transcodage qui vont se retrouver paramétrés en SD recadrée, MPEG-2, stéréo, etc.
Si le diffuseur veut faire une rediffusion du film en version originale plus tard (à minuit…), il reprend le même IMP, choisit cette fois la CPL VO, mais lui applique la même OPL, la French TV. Il a maintenant une version originale, mais toujours en SD recadrée, MPEG-2, stéréo, etc.
Ensuite, cet IMP peut être conservé – bien que pour le moment l’IMF ne soit pas réellement défini comme un format d’archivage.
IMP additionnel
Les IMP peuvent comporter dans un même dossier tout ce qui leur est nécessaire, mais il est également possible – comme on le fait pour les DCP – d’avoir des Supplemental IMP, des IMP additionnels qui complètent un IMP principal. Si, par exemple, on fait une version où une portion de scène doit être retirée pour des raisons de censure, il sera peut-être nécessaire de faire un raccord sur le son. Pour cette version, on fera un IMP additionnel qui ne contiendra qu’un petit bout de fichier audio et une CPL, laquelle lira les essences de l’IMP principal en sautant la scène censurée et en lisant le raccord son. Évidemment, un IMP additionnel est inutilisable sans l’IMP qu’il complète.
Où en est-on ?
Les avantages d’IMF sont clairs : au lieu d’avoir à distribuer des dizaines, voire des centaines, de PAD différents, on confie un seul master d’où chaque diffuseur peut tirer ce dont il a besoin. Le HDForum et la Ficam ont commencé leurs travaux en 2008. L’EBU a rejoint l’AMWA en 2010. L’ETC/SMPTE a publié la version 1.0 de l’IMF début 2011, et la version 2.0 devrait arriver cette année.
Globalement, l’IMF est prêt. La définition des OPL est encore en développement, entre autres dans l’attente de retours d’utilisateurs, et elle ne sera sans doute pas prête avant fin 2013. Mais les OPL ne sont pas indispensables pour commencer à utiliser l’IMF.
Outre les studios à l’origine de cette démarche, on trouve plus de cent sociétés et consultants qui s’impliquent dans l’intégration de l’IMF.
Parmi les constructeurs, Rohde & Schwarz (ex DVS) l’ont implémenté dans le Clipster ; Amberfin prépare leurs systèmes de transcodage pour le supporter ; Green International Consulting a des systèmes disponibles ; MIST de Marquise Technologies produit des IMP.
Par ailleurs, l’IMF est le format retenu par le CNC pour la numérisation du patrimoine. Disney prépare une nouvelle bibliothèque (library) de masters au format IMF. Sony a annoncé en février qu’il l’utilise pour le re-mastering du 2K en UHD. L’IMF peut être implémenté librement dans toute application, mais, comme toujours, le succès de ce standard dépendra de l’implication de tous. S’il prend, tous les intervenants
de la chaîne, producteurs, prestataires techniques, distributeurs, diffuseurs, verront leurs méthodes de travail transformées.
Sources
– Conférence d’Annie Chang, Vice-President Post Production Technologies, The Walt Disney Studios, 2012 (www.smpte.org/PDA_On-demand/IMF). Remerciements à Mike Krause.
– Conférence de Matthieu Parmentier, chef de projet innovations & développements à France Télévisions, donnée le 6 juin lors de la journée Rohde & Schwarz. Remerciements pour sa relecture.
– Laurence Stoll de Marquise Technologies (www.marquise-tech.com).
– Forum IMFF (Interoperable Master Format Forum) (www.imfforum.com/IMF_Forum/Home.html).
– AMWA (www.amwa.tv/).
– FIMS (www.amwa.tv/projects/FIMS_projects.shtml).