Le big data au cœur du pilotage des audiences (partie II)

Suite et fin de notre tour d’horizon de quelques points clés et cas d’usage de la révolution big data en marche, un big data qui se met au service du marketing, de la publicité, de la recommandation et va encore plus loin.*
BANDEAU_DATA.jpg

 

Le big data au service du marketing et de la publicité

Corollaire de l’analyse ergonomique poussée permise par le big data, un pan entier de la pénétration récente de l’analyse de gros volumes de données dans l’univers audiovisuel réside dans l’analyse comportementale des internautes qui regardent des vidéos avec comme objectif de contextualiser au maximum l’insertion des publicités dans le continuum du parcours de l’utilisateur.

La société américaine Ooyala propose une plate-forme technique complète allant dans ce sens de l’optimisation des workflows vidéo jusqu’à leur monétisation. Cette start-up, fondée en 2007 par d’anciens ingénieurs de Google, a des clients parmi les éditeurs de chaînes traditionnelles comme le groupe M6, RTL TV ou Next TV qui tirent l’essentiel de leurs revenus de la vente de clips publicitaires.

Comme le souligne Frédéric Dumeny, directeur Europe du Sud de Ooyala : « Une chaîne de télévision qui distribue en streaming des programmes premium a des objectifs bien différents des plates-formes vidéo du type YouTube ou Dailymotion. Elle doit au maximum optimiser ses revenus par utilisateur avec la publicité, là où les plates-formes de partage vidéo disposent d’un réservoir de contenus quasi-illimités et ont une approche plus quantitative basée sur le CPM (Coût Par Mille) ».

C’est pourquoi aussi Ooyala n’a pas hésité, il y a deux ans, à faire l’acquisition de la start-up Video Plazza spécialisée dans les outils de contournement des « Ad Blockers ». Elle propose désormais des solutions technologiques basées sur l’analyse des habitudes de consommation des internautes visant à adapter la pression publicitaire suivant les moments de la journée et les habitudes de consommation de chaque internaute.

Via un algorithme apprenant à partir des habitudes de visionnage d’une personne, Ooyala catégorise les profils d’usagers qui regardent des informations chaudes le matin et ont besoin d’accéder rapidement aux vidéos avec peu de publicités en pre-roll. À l’inverse, ces mêmes personnes, le soir, vont vouloir consommer du long tail et supportent facilement plusieurs minutes de publicité avant et pendant leur visionnage vidéo qui sera d’une durée plus longue. Ooyala insiste sur le fait que pour fournir ce genre d’informations très qualitatives, il ne stocke pas de données personnelles, mais uniquement des données comportementales et contextuelles agrégées sur les catégories de personnes et leur navigation au sein d’un service de streaming vidéo.

Ooyala s’attache aussi, avec des clients comme Pac12 Entreprises aux USA qui diffuse les vidéos des compétitions des universités américaines, à catégoriser les publics suivant qu’ils s’intéressent à un sport donné, aux résultats de l’université, d’une équipe en particulier… Ainsi, les publicités sont adressées de manière plus ciblée.

 

De la publicité TV programmatique à la publicité géolocalisée

Depuis deux ans environ, la publicité programmatique, c’est-à-dire la vente des espaces publicitaires de manière automatisée grâce à des algorithmes, a envahi l’ensemble des écrans numériques, y compris dans le domaine de la vidéo. Pour autant, l’analyse des logs en masse au niveau local et l’adressage des données de manière géolocalisée est une nouvelle étape que les éditeurs TV sont en train de franchir avec l’aide technique du big data.

Ooyala a travaillé notamment sur la mise en place d’outils d’Analytics poussés pour le compte de BFM Paris, qui propose désormais des publicités géolocalisées pour tous les abonnés SFR recevant la chaîne d’information locale. Cela reste une expérimentation limitée, car depuis 1992 l’environnement légal est assez contraignant en France pour les éditeurs nationaux qui voudraient faire de la publicité locale.

Mais le train du big data est en marche pour un éditeur TV qui voudrait connaître parfaitement un bassin d’audience local et ensuite adresser des publicités à telle ou telle catégorie de personnes de manière parfaitement géolocalisée. Il faut savoir que des pays comme les États-Unis et la Norvège sont déjà très avancés en matière de publicités géolocalisées.

 

Le big data au service de la recommandation

Qui veut se lancer dans la VOD ou sVOD a la nécessité d’entrer dans une démarche big data, afin de connaître finement son audience, la « piloter » et susciter ainsi des actes d’engagement forts, comme l’achat de programmes. On a beaucoup glosé sur les « merveilles » réalisées par les algorithmes de recommandation de Netflix, mais on oublie un peu vite qu’il y a derrière ces modélisations statistiques et sémantiques à grande échelle un travail important sur les outils big data et pas mal d’humains aussi qui vérifient et complètent les quelque 73 000 catégories estimées au sein des catalogues de films et séries de Netflix.

En France, nous avons aussi une start-up spécialisée dans ce registre, Spideo qui s’est fait une spécialité, via des cas d’usage comme Canal Play, de faire de la recommandation « contenu à contenu » basée sur les outils big data afin d’être en mesure d’assumer des volumes importants d’analyses en temps réel, par exemple lors des pics d’audience du début de soirée.

Pour Thibault d’Orso, le PDG de Spideo : « La maîtrise d’ElasticSearch et d’outils comme Kafka est au cœur du savoir-faire de l’entreprise autant que la catégorisation des films et séries ou la conception d’algorithmes. Notre maîtrise du big data nous permet de traiter au fil de l’eau plus de 3 000 requêtes par seconde lors des pics d’audience et de fournir ainsi une information individualisée et pertinente à chacun sans goulet d’étranglement. »

Pour proposer une qualité de recommandation en temps réel, Spideo travaille aussi sur plusieurs couches de données avec des stratégies différenciées, certaines données étant pré-calculées tandis que d’autres nécessitent le temps réel.

Rappelons que Spideo croise trois types de données différentes pour faire ses recommandations que sont les centres d’intérêt des spectateurs, l’empreinte sémantique d’un film ou d’une série, et le parcours de l’utilisateur sur la plate-forme sVOD.

Il est bien difficile d’évaluer l’efficacité de la recommandation, car le taux de transformation en acte d’achat ou de visionnage est aussi lié à la manière dont une recommandation est intégrée dans une plate-forme sVOD. Toutefois, selon Thibault d’Orso, elle a un impact en moyenne de 20 à 25 % sur l’acte d’achat d’un film ou d’une série et peut parfois doubler pour des typologies de contenus plus rares.

Ooyala qui, de son côté, propose également un module de recommandation directement dans son player vidéo, n’est pas très éloigné de ce genre d’estimation. Selon Frédéric Dumeny, « la plupart des clients qui implémentent notre module de recommandation améliorent de 30 % l’incrémental de consommation des vidéos pour une même personne ».

 

Quand les vidéos deviennent sémantiques et big data

L’approche big data permet aussi d’aller plus loin que la recommandation, l’optimisation publicitaire, la monétisation ou l’amélioration de l’UX. Plusieurs start-ups, françaises se servent en effet des outils big data pour enrichir les contenus vidéo de métadonnées des éditeurs TV et attirer ainsi de nouvelles audiences via les réseaux.

Pour FlameFy, cela consiste à rapprocher les producteurs de contenus premium de leur audience par différents moyens. FlameFy se sert notamment du big data et du machine learning pour générer des tableaux de bord interprétables concernant le niveau d’implication et d’intérêt d’une audience sur un sujet donné. Toutefois, disposer de « data » n’a que peu de valeur si celles-ci ne sont pas utilisées de manière automatisée au sein de processus d’engagement. C’est pourquoi cette start-up propose désormais directement aux ayants droit de valoriser leur contenus premium sans avoir à faire le grand écart entre des diffuseurs traditionnels, auxquels il est devenu de plus en plus difficile de vendre des programmes, et des réseaux de partage vidéo, comme YouTube, qui dégradent leur marque et ne rapportent pas de revenus suffisants.

Selon Cédric Monnier, le P-DG de FlameFy : « il existe des gisements de valeur dans le fait que le public visionne des contenus moyennant une donation à une œuvre caritative ou une entrée en conversation avec un annonceur. Aujourd’hui, face à des données associées aux vidéos orientées sur deux axes : un meilleur référencement des contenus sur Google et la vente sur les marchés internationaux, il existe une troisième voie qui consiste à générer des métadonnées en masse autour de contenus qualifiés dans le but d’affiner les stratégies d’engagement du téléspectateur. »

FlameFy couple ainsi le big data avec des techniques comme la reconnaissance d’images dans les films de documentaires ou les reportages, afin de calculer la récurrence d’apparition d’un personnage durant un programme. Il est alors possible d’orienter le spectateur de manière rapide et pertinente dans ses choix, voire de lui proposer uniquement les séquences, à l’intérieur de programmes, qui correspondent à ses centres d’intérêt.

Le big data peut intervenir très tôt dans le pilotage des audiences d’un média, voire en amont de la création de celui-ci. Dans un tel cas de figure, la start-up « crawle » un panel d’un millier de personnes intéressées par le futur sujet de l’émission à partir du nombre de visionnages sur YouTube, Twitter ou Facebook. Cette méthode permet d’une part de repérer les influenceurs qui vont être les ambassadeurs d’une nouvelle émission ou d’un nouveau service et d’autre part de fournir un enrichissement des métadonnées associées à des vidéos, selon une logique sémantique qui servira par la suite à éditorialiser le programme. Pour parvenir à des résultats suffisamment qualitatifs, FlameFy est obligé d’agréger des dizaines de millions de points de données émanant notamment des réseaux sociaux, dont certaines sont accessibles gratuitement, mais d’autres sont achetées auprès de Facebook, Twitter et autres LinkedIn.

 

Leankr enrichit la parole des émissions de télévision

Avec une approche centrée sur les contenus, proche de celle de FlameFy, la start-up Leankr enrichit, quant à elle, à la volée via un outil de reconnaissance de la parole (speech to text) les données associées à des contenus d’émissions de télévision. Les bases de données sémantiques volumineuses qui en découlent permettent ensuite plusieurs usages.

Pour 6Play par exemple, Leankr réalise en temps réel durant les émissions une analyse fine des tweets. Ses données sont couplées avec la base de données sémantique qui caractérise les moments clés de l’émission. Et ainsi, l’application de l’émission propose de synchroniser automatiquement les sujets des tweets avec le déroulé de l’émission.

Actuellement, Leankr va même plus loin en partenariat avec le quotidien régional « Ouest France ». Cette start-up est à l’origine des liens contextualisés à l’intérieur des pages du site web du journal entre les contenus des articles et des extraits vidéo du magazine de la santé présenté par Michel Cymes et Marina Carrère d’Encausse se rapportant directement au sujet traité dans l’article. Pour ce faire, Leankr a qualifié chaque mot du contenu des émissions sur plusieurs années et ainsi, grâce à ce marketing croisé entre vidéos du producteur et articles des journalistes, les vidéos trouvent une nouvelle exposition de manière très pertinente et vers un large public. Ce premier cas d’usage démontrant un modèle d’affaires vertueux devrait en appeler d’autres. À terme, Leankr imagine même que la télévision se délinéarise encore un peu plus au niveau des extraits grâce à de tels cas de réexposition au sein de carrefours d’audiences du web.

On le voit au travers de ces différents cas d’usage les technologies big data sont en train d’ouvrir un nouveau champ immense de transformation des vidéos en données exploitables à grande échelle en vue de piloter les audiences.

 

* Extrait de l’article paru pour la première fois dans Mediakwest #21, p.68-74. Abonnez-vous à Mediakwest (5 nos/an + 1 Hors série « Guide du tournage) pour accéder, dès leur sortie, à nos articles dans leur totalité.

La première partie de cet article est à lire ici