クローズド・キャプションは、アクセシビリティとユーザビリティにとって良いことであり、インターネット・ビデオが成熟に向かって前進するための、また新たなマイルストーンである。残念ながら、クローズド・キャプションは、単一の技術やビデオの「機能」として「オン」にできるものではありません。多くのフォーマット、標準、アプローチがある。
クローズドキャプションは、デジタルビデオの他の部分と同様、厄介なもので、マルチスクリーンパブリッシャーにとっては特に難しいものです。今日、ウェブ、モバイル、コネクテッドTV向けに動画を配信したい場合、クローズドキャプションについて何を知っておく必要があるでしょうか?
この記事では、クローズド・キャプションの仕組み、知っておくべきフォーマット、すべての画面でクローズド・キャプションを有効にする方法など、基本的なことを概説します。
クローズド・キャプションの仕組み
まず理解しなければならないのは、クローズド・キャプションがどのように配信され、保存され、読まれるかである。現在、主に2つのアプローチがある。
- ビデオ内に埋め込む。CEA-608、CEA-708、DVB-T、DVB-S、WST。これらのキャプション・フォーマットは、データ・トラックとして、またはビデオ・ストリーム自体に埋め込まれて、ビデオ・ファイルに直接書き込まれる。放送テレビは、iOSと同様にこの方法を採用している。
- 別ファイルとして保存。DFXP、SAMI、SMPTE-TT、TTML、EBU-TT(XML)、WebVTT、SRT(テキスト)、SCC、EBU-STL(バイナリ)。これらのフォーマットは、動画自体に埋め込まれるのではなく、動画と一緒にプレーヤーにキャプション情報を渡します。この方式は通常、ブラウザベースの動画再生で使用される。
字幕とクローズドキャプションの違い
字幕についてはどうですか?クローズド・キャプションと同じものなのでしょうか?主な違いは3つあります。
目標クローズド・キャプションはアクセシビリティ機能のひとつで、耳の不自由な方でもビデオを視聴できるようにするものです。字幕は国際化機能であり、話し言葉を理解できない人々がビデオを利用できるようにします。言い換えれば、ミュートでビデオを見るには字幕を使い、理解できない言語のビデオを見るには字幕を使うということです。注:この区別は北米では通用しますが、世界の多くの国ではクローズド・キャプションと字幕を区別していません。
保存。歴史的に、キャプションはビデオに埋め込まれ、字幕は外部に保存されてきました(下記のCEA-608を参照)。なぜなら、字幕は常にビデオとともに提供されるべきものであり、難聴者のための100%のアクセシビリティが法律で義務付けられているからです。ドイツで放送されるドイツ語のビデオにはドイツ語の字幕は必要ありませんが、フランスで放送される同じビデオには字幕が必要なのです。
再生。キャプションはビデオと一緒に渡され、テレビやその他のコンシューマー機器によって解釈/表示されるため、視聴者はテレビ自体を使っていつでも自分でオン/オフを切り替えることができますが、言語を選択するオプションがあることはほとんどありません。このような状況で、翻訳目的で字幕が追加される場合、一般的にハード・サブタイトル(下記参照)であるため、無効にすることはできません。しかし、DVD/ブルーレイ/VODビデオを見る場合、字幕を表示するかどうか、またどの言語で表示するかは、再生機器がコントロールします。
フォーマットと規格
クローズドキャプションや字幕のフォーマットや規格は何十種類もあります。ここでは、インターネット動画で最も重要なものを紹介します。
- CEA-608。ライン21とも呼ばれるCEA-608キャプションは、米国とカナダのアナログテレビで使用されているNTSC規格である。ライン21キャプションは、放送のプレイアウト機器によって、ビデオストリームの隠れた領域に直接エンコードされます。番組の上部に白いバーやドットが表示されているのを見たことがあれば、それがライン21キャプションです。
- SCC。このファイルには、Scenarist Closed Captionフォーマットのキャプションが含まれています。CEA-608データの表現として、SMTPEタイムコードと対応するエンコードされたキャプションデータが含まれています。
- CEA-708。これは、米国とカナダにおけるATSCデジタルテレビ(DTV)ストリームのクローズドキャプションの標準である。現在、ビデオストリームとは別にCEA-708キャプションを保存するための標準ファイル形式はありません。
- TTML。Timed Text Markup Languageは、テキストとオーディオやビデオなどの他のメディアの同期を記述します。詳しくはW3C TTML勧告をご覧ください。
- DFXP。これはW3Cによって定義されたTTMLのプロファイルです。DFXPファイルには、キャプションデータをいつ、どのように表示するかを定義したTTMLが含まれています。DFXPは、Distribution Format Exchange Profileの略です。DFXPとTTMLはしばしば同義語として使われます。
- SMPTE-TT。Society of Motion Picture and Television Engineers - Timed Textは、DFXPプロファイルの拡張で、他のキャプションフォーマットや情報項目にはあるが、DFXPにはない3つの拡張子のサポートを追加したものである:#data、#image、#informationです。SMPTE-TTは、FCCセーフハーバーフォーマットでもあります。ビデオコンテンツ制作者がこのフォーマットで配信者にキャプションを提供すれば、アクセシブルなフォーマットでキャプションを提供する義務を果たしたことになります。ただし、ビデオコンテンツ制作者と配信事業者は、別のフォーマットで合意する自由があります。
- SAMI。Synchronized Accessible Media InterchangeはHTMLをベースにしており、Microsoft Encarta EncyclopediaやWindows Media Playerなどの製品用にMicrosoft社によって開発された。SAMIは、多くのデスクトップビデオプレーヤーでサポートされています。
- EBU-STL。これはEBU規格で使用されているバイナリ形式で、個別の.STLファイルに格納されている。
- EBU-TT。これはEBUがサポートする新しいフォーマットで、TTMLに基づいている。EBU-TTはTTMLの厳密なサブセットであり、EBU-TT文書は有効なTTML文書であるが、一部のTTML文書はEBU-TTでサポートされていない機能を含むため、有効なEBU-TT文書ではない。
- SRT。これは、動画から字幕やキャプションを抽出するためのWindowsベースのオープンソースツールであるSubRipによって作成されたフォーマットです。SRTは、デスクトップのビデオプレーヤーで広くサポートされています。
- WebVTT。これはSRTに似たテキスト形式である。Web Hypertext Application Technology Working Group(WHATWG)は、HTML5ビデオ・クローズド・キャプションの標準としてWebVTTを提案している。
- ハード字幕。ハードサブタイトルは定義上、クローズドキャプションではありません。ハードサブタイトルはビデオ自体にエンコードされたオーバーレイテキストであるため、クローズドキャプションやソフトサブタイトルとは異なり、オン/オフを切り替えることはできません。可能な限り、一般的にはソフト字幕またはクローズドキャプションが好まれますが、クローズドキャプションに対応していないデバイスやプレーヤーをターゲットにする場合は、ハード字幕が便利です。
あらゆるデバイスに対応するキャプション
どのようなフォーマットが、どのような機器やプレーヤーで使われているのか?
- HTML5。キャプションはまだブラウザによって広くサポートされていませんが、時間の経過とともに変わっていくでしょう。競合する2つの標準があります:W3Cが提案したTTMLと、WHATWGが提案したWebVTTです。現時点では、ChromeはWebVTTを限定的にサポートしており、Safari、Firefox、OperaはすべてWebVTTのサポートに取り組んでいます。ブラウザがネイティブでフォーマットをサポートするまで、Video.jsのようなHTML5プレーヤ・フレームワークは、外部ファイルを解析することにより、Javascriptを介してキャプションをサポートすることができます(Video.jsは現在WebVTTキャプションをサポートしています)。
- iOS。アップルは異なるアプローチを取っており、CEA-708/ATSCレガシーエンコーディングの修正版を使用してCEA-608キャプションを使用しています。つまり、HTML5 とは異なり、トランスコード時にキャプションを追加する必要があります。Brightcove Zencoder は、iOS 用 HTTP ライブ ストリーミング動画にキャプションを追加できます。
- アンドロイド。ビデオプレーヤーのサポートはまだ断片的で問題がある。キャプションのサポートは、明らかにOSのバージョンと使用するプレーヤーに依存します。
- その他のモバイル機器。クローズド・キャプションにまったく対応していないものもあり、ハード・サブタイトルが唯一の選択肢となる場合もあります。
- Roku。外部SRTファイルによるキャプションをサポート。
- その他のコネクテッドTVプラットフォーム。まだクローズドキャプションに対応していないものもある。しかし、すぐに対応するだろう。現在市場に出回っているすべてのテレビ、コンソール、ケーブルボックス、ブルーレイプレーヤーは、インターネットコンテンツのストリーミングを望んでおり、今後1年半の間に、クローズドキャプションは必須となるだろう。そのため、ソニー、サムスン、ヴィジオ、グーグルTVなどは、いずれキャプション・サポートをアプリケーション開発フレームワークの一部にすることになるだろう。残念ながら、どのようなフォーマットが使用されるかはまだ明らかではない。おそらく、今後何年にもわたって、さまざまなプラットフォームが互換性のないさまざまなフォーマットをサポートし続けるだろう。
クローズド・キャプションの要件
クローズド・キャプションの状況は時間とともに変化し、成熟していきますが、2012年現在、一般的なデバイスでクローズド・キャプションをサポートするための最も一般的な要件は以下のとおりです。
- クローズドキャプションの有効・無効をプレーヤー側でコントロールできるウェブプレーヤー。
- WebVTT、TTML、またはSRTのようなフォーマットを使用した、キャプションデータの外部ファイル。複数のファイルが必要な場合もあります(Roku用のSRTとHTML5用のWebVTTなど)。
- Zencoderのように、iPad/iPhone配信用のHTTPライブストリーミングにクローズドキャプションを埋め込むことをサポートするトランスコーダ。Zencoderは、TTMLを含むさまざまな形式のキャプション情報を受け入れることができるため、パブリッシャーは1つのTTMLファイルをウェブ再生とiOSビデオ用Zencoderへの入力の両方に使用することができます。
それ以上は難しくなります。他のデバイスには他の入力フォーマットが必要になるかもしれないし、レガシーデバイス間で100%の互換性を保つには、おそらく焼き込みの字幕が必要になることでしょう。
Brightcove Zencoder とキャプション
Brightcove Zencoderは、2 つの形式のクローズド キャプションをサポートします:HLS を使用した iOS 機器用の CEA-608 スタイルのキャプションと、CEA-608 キャプション トラックを含む MP4 ファイルです。入力側では、MP4 ファイルの SCC、SAMI、DFXP/TTML/SMPTE-TT、および CEA-608 キャプション トラックをサポートします。
これらのフォーマットは、トランスコードの時点でビデオファイルに追加されるためです。そのため、iPadやiPhone向けのキャプションをサポートしていなければ、これらのデバイス向けにパブリッシングするお客様はクローズドキャプションを使用できません。将来的には、受け入れるキャプション形式の範囲を拡大し、外部キャプションファイルの形式変換(TTMLからWebVTTなど)などのサービスを提供する予定です。
一方、1 つのキャプション ファイルと適切な HTML5 プレーヤがあれば、ブライトコーブの顧客は、Web、モバイル、Connected TV 機器向けにキャプション付き動画を作成するために必要なすべてを手に入れることができます。