Para seguir siendo competitivos, los servicios OTT reconocen que los vídeos deben reproducirse sin problemas en cualquier dispositivo, desde televisores inteligentes conectados por fibra hasta smartphones con conectividad limitada. Además, la transmisión en streaming supone un gasto importante, sobre todo si el espacio de almacenamiento y el ancho de banda se amplían de forma ineficiente.
Hoy en día, un enfoque estratégico de la transcodificación de vídeo es vital para cualquier proveedor de servicios de streaming. Al optimizar el tamaño de los archivos y la calidad de la transmisión espectador por espectador, estos gastos pueden reducirse significativamente al tiempo que se sientan las bases para un crecimiento rentable y a largo plazo.
¿QUÉ ES LA TRANSCODIFICACIÓN DE VÍDEO?
La transcodificación es el proceso de convertir un archivo de vídeo de un formato a otro. Consiste en ingerir un vídeo, descodificarlo en un formato intermedio y, a continuación, volver a codificarlo en el formato deseado.
TRANSCODIFICACIÓN VS. CODIFICACIÓN
La codificación comprime los datos en bruto, que a menudo son demasiado grandes para transmitirlos, en un formato digital más manejable. La transcodificación, por su parte, convierte los archivos codificados en otros formatos para distribuirlos a través de distintos dispositivos, plataformas y redes.
TRANSCODIFICACIÓN VS. TRANSMISIÓN
Cuando la transcodificación convierte el formato de archivo de un vídeo, cambia atributos inherentes como la velocidad de bits, el tamaño de los fotogramas o el códec de vídeo. La transmutación, por su parte, simplemente cambia la forma en que se empaqueta un vídeo para su distribución; no recodifica los datos de vídeo y audio. Mientras que la transcodificación afecta a aspectos como el ancho de banda y el almacenamiento, la transmultiplicación se ocupa de la compatibilidad de dispositivos.
¿CÓMO FUNCIONA LA TRANSCODIFICACIÓN DE VÍDEO?
Dado que no se trata de un proceso aislado, la mejor forma de entender cómo funciona la transcodificación es contextualizarla con su lugar en el flujo de trabajo de streaming, desde la ingesta hasta la entrega.
VIDEO INGEST
Antes de transcodificar los vídeos, los archivos se cargan en un sistema de gestión de contenidos (CMS), una plataforma de streaming o un proveedor de transcodificación en la nube.
La ingesta puede ser un proceso manual o automatizado mediante soluciones como la API de ingesta dinámica de Brightcove. En este caso, los archivos fuente de vídeo se recuperan automáticamente directamente de su ubicación de almacenamiento preferida y se crean las variantes de representación especificadas de los archivos fuente. Esto le permite indicar al sistema exactamente cómo crear las variantes de representación.
Por ejemplo, puede especificar que para un archivo de vídeo de 1080p y 10 Mbps se creen ocho variantes de representación con distintas tasas de bits y resoluciones, de 1920×1080 a 640×360, en formatos HLS y DASH. El sistema permite definir varios perfiles para una cuenta, lo que significa que una sola cuenta de Brightcove puede contener diversos tipos de variantes de representación.
TRANSCODIFICACIÓN DE VÍDEO
Tras la ingesta, los archivos de origen se convierten o transcodifican en formatos adecuados para diversos casos de uso.
Por ejemplo, imagina un vídeo grabado con un smartphone en 8K. Es demasiado grande para adjuntarlo en la mayoría de las aplicaciones de mensajería, así que éstas lo comprimen. Dependiendo del tamaño del vídeo, esto puede llevar un minuto entero o más. Ahora imagina publicar el vídeo en un sitio web, una plataforma social y una aplicación OTT, pero convirtiéndolo al mejor formato de visualización para cada punto final en cuestión de segundos. Eso es lo que hace la transcodificación.
Dado que esta es la parte más crucial del proceso, querrá asegurarse de que dispone de una solución rápida y de alta calidad que pueda satisfacer todas sus necesidades de salida. Zencoder de Brightcove ofrece un enfoque basado en la nube para proporcionar la transcodificación estándar más rápida, una fiabilidad líder en el sector, una compatibilidad de archivos de entrada inigualable y compatibilidad de salida con todos los dispositivos conectados.
EMBALAJE Y ENTREGA DE VÍDEOS
Una parte fundamental del proceso de transcodificación es el empaquetado de los medios para su distribución en streaming o descarga. Hoy en día, los protocolos de streaming combinan o empaquetan múltiples variantes de representación de distinta calidad (lo que se denomina Adaptive Bitrate Streaming o ABR) en un único recurso descrito por un archivo de manifiesto. Esto permite al flujo "adaptarse" a las condiciones de la red y mantener la experiencia de visualización. Los formatos de streaming más utilizados son HLS y DASH.
-
- HLS. HTTP Live Streaming es un protocolo de streaming desarrollado por Apple. HLS admite varios códecs de audio y vídeo (h.264, HEVC), varias variantes de representación de audio y vídeo y un tamaño de segmento variable. La estructura del manifiesto consiste en un archivo de manifiesto maestro (.m3u8) que hace referencia a archivos de manifiesto únicos para cada variante de representación. HLS es un formato maduro compatible con todas las plataformas de Apple y con otras muchas plataformas y dispositivos.
-
- DASH. Dynamic Adaptive Streaming over HTTP es un protocolo de streaming altamente personalizable desarrollado por MPEG. DASH también admite múltiples códecs para audio y vídeo (h.264, HEVC), múltiples variantes de representación de audio y vídeo y tamaño variable de los segmentos. DASH es compatible con una gran variedad de dispositivos móviles, navegadores web, dispositivos conectados y televisores inteligentes. DASH no es compatible de forma nativa con los dispositivos Apple.
Antes de reproducir el contenido de vídeo, el reproductor analiza factores como el ancho de banda y el tamaño de la pantalla para seleccionar la variante de representación más adecuada para disfrutar de la mejor experiencia visual.
SOLUCIONES AVANZADAS DE VÍDEO
Algunas tecnologías avanzadas seleccionan variantes de representación en función de contextos adicionales, como el tipo de contenido, las capacidades del dispositivo, las condiciones de la red y el comportamiento del espectador. Por ejemplo, Context-Aware Encoding (CAE) de Brightcove utiliza el aprendizaje automático para analizar los archivos de origen y crear escalas de codificación personalizadas (conjuntos de variantes de representación) para cada contenido. Esto puede mejorar la experiencia de visionado y reducir los costes.
Aun así, la distribución de vídeo a múltiples dispositivos puede inflar rápidamente los costes de almacenamiento y ancho de banda, especialmente con contenidos controlados por DRM. Los proveedores de gestión de derechos digitales (DRM) como FairPlay y Widevine sólo son compatibles con determinados dispositivos. Por lo tanto, si es necesario transcodificar para varios puntos finales, llegar a un público amplio podría significar almacenar muchas variantes de representación de gran tamaño.
Para que los costes sean razonables, Brightcove también ofrece la entrega dinámica. A diferencia de la entrega estática, en la que cada variante de representación se empaqueta durante la ingesta de vídeo, la entrega dinámica almacena las variantes de representación como MP4 más pequeños y fragmentados. Cuando un dispositivo solicita el vídeo, el empaquetado justo a tiempo (JIT) crea el formato de secuencias y DRM adecuado utilizando los fMP4, lo que reduce drásticamente los costes de almacenamiento.
La matriz de dispositivos, navegadores y redes, en constante expansión, exige que los proveedores de contenidos conozcan a fondo la transcodificación de vídeo y las opciones disponibles. Aunque ofrecer contenidos que respondan a las diversas y cambiantes necesidades de los espectadores puede ser complejo, las soluciones avanzadas actuales lo hacen posible y eficaz.
Este blog fue escrito originalmente en 2016 por Ameet Bharwani y ha sido actualizado para mayor precisión y exhaustividad.