2019年3月25日
自然言語解析を手軽に利用できる「COTOHA API」に「音声認識」APIを追加
~AIによる自動応答などに活用できる、世界最高水準の音声認識技術をAPIで手軽に利用可能~
NTTコミュニケーションズ株式会社(以下 NTT Com)は、NTTグループの40年以上にわたる自然言語解析技術の研究成果を手軽に利用できるAPIサービス「Communication Engine “COTOHA® API”」(以下「COTOHA API」)において、2019年3月26日より「音声認識」API(以下 本API)の提供を開始します。
1. 概要と特長
本APIは、日本語の発話内容(音声データ)を高精度で認識し、日本語のテキストデータに置き換えることができます。人間が話した内容を、コンピューターが処理しやすいテキストデータに変換することによって、AIを利用したさまざまなサービスにおける音声入力インタフェースとしてご利用いただくことが可能です。
(1) 雑音にも強く高精度
本APIは、NTTグループのAI 関連技術「corevo® (コレボ)※1」の研究成果を活用しており、人間の声を深層学習によって精緻に分析できるほか、雑音に強い独自の音響モデル※2と発話区間検出技術により、世界最高水準※3の認識率を実現しています。
(2) 認識結果を保存しないセキュアな仕様
本APIが処理した音声データ、および認識結果のテキストデータは、サーバー上に一切残らないため、個人情報を含む通話記録や、社内会議の音声など機密性の高い情報も安心してお取り扱いいただくことができます。
(3) 単語登録機能で、即時の精度向上が可能
お客さまの用途に合わせ、よく使う業界用語、専門用語、また自社の商品やサービス名を登録することが可能です。これにより、お客さまご自身で即時に認識精度を高めることができます。また、無料期間中(利用開始月を含む3カ月間)には、精度向上のための単語登録に関するサポートを、ご希望のお客さま向けに実施いたしますのでご相談ください。
2. 提供開始日
2019年3月26日
3. ご利用料金
「COTOHA API」として提供中の他のAPIも含め、以下の料金体系でご利用いただけます※4。なお、利用開始月を含む3カ月間の料金は無料です。
- 初期費用:無料
- 月額費用:基本料金13万円(税抜)+APIコール数に応じた従量課金(音声認識の場合は約5万分/月まで基本料金のみでご利用可能)
詳細は「COTOHA® API Portal」内の下記Webページからお問い合わせください。
「COTOHA® APIお問い合わせ」 https://api.ce-cotoha.com/contents/contact.html
4. お申し込み方法
「COTOHA® API Portal」内の下記Webページからお申し込みください。
「COTOHA® APIお問い合わせ」 https://api.ce-cotoha.com/contents/contact.html
5. 今後の展開
NTT Comは、お客さまに本APIを提供するだけでなく、本APIを活用したサービスの開発や提供も行っていきます。
(1) 「COTOHA Voice Insight」
コンタクトセンターの通話録音データをテキスト化し、応対内容やお客さまの声の可視化を安価で安全に実現するクラウドサービスです。(2019年4月提供予定)
(2) 「Arcstar Conferencing TV Conferencing字幕翻訳機能(仮称)」
リモート会議サービスの付加機能として、会話されている内容を本APIによってテキスト化し、リアルタイムで画面に表示することができるサービスです。(2019年4月PoC受付開始)
また、翻訳APIと組み合わせることによって会話内容をリアルタイムで翻訳することも可能となり、海外との会議においても活用できます。(2019年度提供予定)
6. 出展情報
「第3回AI・人工知能EXPO」において、本サービスの出展を行います。ぜひNTTグループの出展ブースまでお越しください。
名称: | 「第3回AI・人工知能EXPO」(AI EXPO TOKYO 2019) |
会期: | 2019年4月3日(水)〜4月5日(金) 10:00〜18:00 |
会場: | 東京ビックサイト(青海展示棟) |
主催: | リード エグジビション ジャパン株式会社 |
URL: | https://www.ai-expo.jp/ |
(参考)「COTOHA API」とは
NTT Comが2018年9月より提供している、AIによる自然言語解析APIです。NTTグループが40年以上にわたって蓄積・精錬した210万語を超える日本語辞書およびAI関連技術「corevo®(コレボ)」と、NTT Comが独自開発した自然言語解析技術を実装しています。
構文解析/固有表現抽出/照応解析/キーワード抽出/類似度算出/文タイプ判定/感情分析/ユーザー属性推定(β版)/言い淀み除去(β版)/音声認識誤り検知(β版)の10個のAPIを提供しており、今回新たに音声認識を追加します。
また、今後も順次ラインアップを強化していく予定です。
※1:「corevo®」は、日本電信電話株式会社の登録商標です。http://www.ntt.co.jp/corevo/
※2:音響モデルとは、認識する音声の周波数特性から音素を特定する際に用いるアルゴリズムのこと。
※3:国際技術評価イベント(CHiME-3)で世界1位の精度を達成した技術を利用しています。詳細は、下記日本電信電話株式会社の報道発表資料をご参照ください。なお、認識率は音声認識を実施する条件により異なるため、当該資料と同等の認識率とならない場合があります。
http://www.ntt.co.jp/news2015/1512/151214a.html
※4:本APIは、検証用の無償メニュー「for Developers」では提供しておりません。商用利用向けの「for Enterprise」のみの提供となります。
関連リンク
本件に関するお問い合わせ先
2019-R020