Select Language : English 日本語

南北アメリカ

ブラジル: English / 日本語 / Português do Brasil
アメリカ: English

ヨーロッパ、中東、アフリカ(EMEA)

EMEA:
(ベルギー, フランス, ドイツ, オランダ, スペイン, アラブ首長国連邦, イギリス)
English / 日本語 / Español / Deutsch / Français
ロシア: English / 日本語 / русский

アジアパシフィック

日本(法人のお客さま): English / 日本語
日本(個人のお客さま): English / 日本語
オーストラリア(NTT Com ICT Solutions): English
中国本土: English / 日本語 / 簡體中文
香港/マカオ: English / 日本語 / 繁体中文 / 簡體中文
インド: English / 日本語
インドネシア: English
韓国: English / 日本語 / 한국어
マレーシア: English
フィリピン(DTSI): English
シンガポール: English / 日本語
台湾: English / 日本語 / 繁体中文
タイ: English / 日本語
ベトナム: English / 日本語

ニュース

平成20年1月21日

世界初、生放送ニュース番組の全自動字幕制作システムを提供開始
~準備に最短10秒、放送中の運用人員0名で、生放送ニュース番組の字幕制作を実現~

NTTコミュニケーションズ(略称:NTT Com)は、平成20年1月22日より、世界初の試みとして、放送局の生放送ニュース番組向けに字幕を全自動で制作する「全自動リアルタイム字幕制作システム」の提供を開始します。

本システムを利用すれば、システム立ち上げ後、最短10秒程度の準備のみ*1で、放送中の運用人員も必要なく、手軽に生放送のニュース番組にも字幕が付与できます。

なお、本システムは、北海道放送やKTS鹿児島テレビなど地域放送局数局と共同実験を実施し、制作した字幕が放送品質であるとの評価を頂いたことを受けて商用化します。

1. 放送局と字幕をめぐる背景

現在、聴覚障害や加齢に伴う難聴者は日本の人口の約5%にあたる約600万人と言われています*2

これを受け、総務省では、平成29年度までの目標として、朝7時から夜12時までに新たに放送する放送番組だけでなく、再放送番組も含めた全ての放送番組(一部例外を除く)に対して、字幕を付与することを目標とする指針*3を制定しました。

2. 「全自動リアルタイム字幕制作システム」の概要(別紙

(1) 事前に準備されている放送用原稿を放送前に字幕テキストに自動変換(字幕テキスト自動変換機能)
(2) 放送開始後に実際のアナウンサーの音声を認識してテキストへ変換(音声認識機能:VoiceRex*4
(3) 事前に登録した字幕テキストとアナウンサーの発話の音声認識結果を照合。
アナウンサーの発話タイミングに同期して、字幕テキストをリアルタイムで自動送出(字幕テキスト自動送出機能)

上記の機能を用いて、本システムは世界で初めて、生放送のニュース番組向けに全自動かつリアルタイムでの字幕制作を実現しました。

3. 本システムの特徴

(1) 事前作業時間を大幅短縮

事前準備は、放送用原稿をシステムに取り込むのみで、後はワンボタンで自動的に字幕制作が可能です。音声認識のための音声や単語の登録作業の必要も無いため、従来の方式*5では通常1時間以上かかる事前作業が最短10秒程度までに大幅短縮します。

(2) 放送中の運用者の必要無し

通常生放送ニュース番組の字幕制作には、従来の方式では2名から5名程度の運用者が必要ですが、本システムを利用した場合、スタジオのアナウンサーの音声を直接入力可能とすることで、放送中の運用人数0名でのリアルタイム字幕制作が実現可能です。

(3) 音声認識率80%前後でも放送品質の字幕制作可能

従来の方式では95%前後の認識率が必要でしたが、原稿とアナウンサーの発話内容がほぼ一致していれば、認識率が80%程度でも問題なく字幕制作可能です。

4. 申込受付開始日

2008年1月22日

5. 提供価格

全自動リアルタイム字幕制作システムソフトウェア一式*6 300万円(税抜価格)

6. 今後の展開

事前準備をより簡易化するため、放送前の原稿取り込み作業についても自動化を検討しています。

また、本システムが現在対応している番組は5分程度のストレートニュースですが、今後は対応可能時間を延長し、地域放送局が夕方放送している情報・ニュース番組にも対応予定です。

より多くの放送局様へ利用いただくためにNTT Comのネットワークサービスと連携し字幕付与のASP事業*7としての提供も検討しています。

さらに、音声認識技術は、字幕制作の分野だけではなく、コールセンター、テレビ会議、議事録作成支援、その他情報端末の制御や検索にも応用できます。字幕はバリアフリー社会を実現するユニバーサルサービスに留まらず、映像、音声、音楽、文字情報等にリンクさせることで、新たな視聴スタイルやユーザーが自由にコンテンツを制作可能な環境を実現します。

NTT Comは本システムの技術を応用し、新たな分野に展開することで、人々に新しいライフスタイルを提供していく予定です。

* 1: 放送用原稿を本システムに取り込む
* 2: 出展:総務省 平成19年3月30日公表 「デジタル放送時代の視聴覚障害者向け放送に関する研究会」報告書
* 3: 出展:総務省 平成19年10月30日公表 「視聴覚障害者向け放送普及行政の指針」概要
* 4: NTTサイバースペース研究所の技術です。
* 5: 従来使用されているリスピーク音声認識方式では、単語や音声の登録に1~2時間程度かかります。
* 6: ハードウェア・諸経費および重畳装置の値段は含みません
* 7: アプリケーションサービスプロバイダー:ビジネス用のアプリケーションソフトを、インターネットを通じて顧客にレンタルする事業者のこと




このページのトップへ