En 2015, les vidéastes du monde entier se sont émerveillés des recherches que Netflix venait d'effectuer et d'appliquer à l'ensemble de sa bibliothèque. Leur approche d'optimisation de l'encodage par titre s'appuie sur une analyse de chaque titre pour déterminer la meilleure façon d'encoder en fonction de la complexité de l'action dans l'image.
LA PRISE EN COMPTE DE LA COMPLEXITÉ DE LA VIDÉO
En termes simples, toutes les vidéos ne sont pas identiques. Le sport est complexe parce qu'il comporte de nombreux mouvements de scène à scène - non seulement des joueurs, mais aussi des mouvements de caméra. En revanche, les dramatiques épisodiques présentent beaucoup moins de mouvements d'une scène à l'autre, et les têtes parlantes des émissions d'information et d'actualités sont généralement celles qui présentent le moins de mouvements.
Cette motion est liée à la complexité de l'encodage : Plus il y en a, plus la vidéo est complexe à encoder. L'approche de Netflix a consisté à examiner chaque élément de contenu et à déterminer comment l'encoder en fonction de sa complexité inhérente. Pour une organisation qui diffuse plus de flux que n'importe qui d'autre, chaque économie et chaque légère optimisation de flux peut avoir un retour sur investissement massif.
Aussi impressionnante que soit cette innovation, il y a toujours des technologues dans ce domaine qui abordent les défis sous un angle différent. C'est ainsi que nous sommes passés de la vidéo de la taille d'un timbre-poste à la vidéo HDR 4K d'aujourd'hui, aux expériences en direct avec enregistreur numérique, et plus encore. Il semble qu'aussi impressionnante que soit la prochaine innovation, il y a toujours un autre technologue de la diffusion en continu qui réfléchit à la manière de construire la proverbiale meilleure souricière.
CONSTRUIRE UN ENCODAGE TENANT COMPTE DU CONTEXTE
Dans ce cas, l'équipe de recherche vidéo de Brightcove, dirigée par le Dr. Yuriy Reznik, a mis au point l'une des dernières innovations vidéo de Brightcove, l'encodage contextuel (CAE). Le CAE reprend le concept d'optimisation de l'encodage basé sur le contenu et l'enrichit d'informations supplémentaires sur les conditions du réseau et la répartition des appareils au sein du public.
L'encodage contextuel, c'est un expert en compression dans une boîte. Pour chaque titre traité, et chaque image qu'il contient, le CAE examine la ressource source et effectue également des calculs concernant l'appareil cible et le réseau par lequel le flux sera diffusé.
Cette approche permet d'optimiser le processus d'encodage de manière à ce que plusieurs attributs de l'échelle de débit soient ajustés, et pas seulement le débit, et d'économiser sur les rendus qui ne sont pas nécessaires. En moyenne, cette approche a permis de réaliser des économies de l'ordre d'un tiers pour la plupart des types de contenu, et jusqu'à 50 % lorsque l'activité in-frame est relativement simple.
TESTER L'ENCODAGE EN FONCTION DU CONTEXTE
Jan Ozer, l'un des experts vidéo les plus connus de l'industrie, a mis à l'épreuve le codage contextuel de Brightcove dans le cadre d'un test large et subjectif.
Comme le dit Jan :
"Pourquoi CAE a-t-il connu un tel succès ? Parce qu'avec cette vidéo synthétique à faible mouvement, il a permis à Brightcove de diffuser une vidéo à plus haute résolution à des spectateurs à plus faible débit qu'avec une échelle traditionnelle. Le résultat illustre les principaux avantages de l'encodage par titre : des spectateurs plus satisfaits, une consommation de bande passante réduite et des coûts de stockage et d'encodage moindres en passant d'une échelle à sept échelons à une échelle à quatre échelons.
Il s'agit là d'un excellent retour d'information pour le codage contextuel, et nous ne faisons que commencer.
Au fur et à mesure que nous travaillerons avec davantage d'éditeurs, de réseaux et de diffuseurs et que nous traiterons davantage de contenu, l'algorithme s'adaptera au fil du temps. En fin de compte, cela signifie que nous continuons à réduire les coûts pour offrir des expériences vidéo riches et attrayantes aux publics du monde entier et transformer l'expérience des médias.