2019年4月8日
コンタクトセンター向けの音声テキスト化AIサービス「COTOHA Voice Insight™」の提供を開始
~セキュアかつ低コストで業務効率化と生産性向上を実現~
NTTコミュニケーションズ株式会社(以下 NTT Com)は、コンタクトセンターを運営する企業向けに、AIによって、お客さまとの通話内容の高精度なテキスト化を可能にするサービス「COTOHA Voice Insight™」(以下 本サービス)を、2019年4月8日より提供開始します。
本サービスでは、コンタクトセンターにおける通話の録音ファイルを専有型のセキュアなクラウド上にアップロードすることで、通話内容をテキストファイルに一括変換することができます。
1.背景
コンタクトセンターにおける応対品質の維持向上には、お客さまからのお問い合わせや、オペレーターの応対内容などの膨大な音声データの利活用が欠かせません。いっぽうで、応対内容の聞き直し(モニタリング)や分析・利活用における稼働などが運営上の課題となってきました。
本サービスは、音声データを自動でテキストデータに変換することにより、これらの課題を解決します。テキスト化することで、目視によるモニタリングや分析が可能になり業務を効率化できるほか、検索や共有、CRMシステムや分析ツールと連携したデータの利活用も可能になるため、オペレーター間でのノウハウ共有やスキルアップなどによる生産性向上、およびコンタクトセンターにおける顧客体験の向上などのさまざまな目的に活用することができます。
2. 特長
(1) 通話内容の高精度なテキスト化を実現
蓄積された音声データを、お客さま専有型のクラウドサーバー上へ閉域網経由でアップロードすることにより、テキストデータへの一括変換をセキュアに実現することができます。変換したデータは、活用しやすいcsv形式でのダウンロードが可能です。
日本語の発話内容(音声データ)を高精度で認識し、テキストデータに置き換えることができる「COTOHA® API」の 音声認識を活用しています。本APIはNTTグループのAI 関連技術「corevo® (コレボ)※1」の研究成果を活用しており、人間の声を深層学習によって精緻に分析できるほか、雑音に強い独自の音響モデル※2と発話区間検出技術※3により、世界最高水準※4の認識率を実現しています。
さらに、本サービスで利用する音声認識APIは、コンタクトセンター向けのチューニングを実施しているため、コンタクトセンター内の業務でよく使われる単語を正確に認識することが可能です。
なお、テキスト化したデータの活用イメージを体感いただくためのお試し機能として、可視化ツールを無償で提供します。
<サービス紹介動画>
COTOHA Voice Insight https://www.youtube.com/watch?v=-i4GmZcEXbw
<可視化ツールの画面イメージ>
(2) ユーザー辞書により手軽に精度向上が可能
商品名やサービス名などの単語を、管理画面から簡単にユーザー辞書へ登録することができ、お客さまご自身で音声認識の精度を高めることが可能です。最大5,000語まで登録することができます。
(3) 専有型のクラウドサーバーと閉域網接続によるセキュアな環境
機密性の高い情報を含む通話データをセキュアに扱うため、お客さま企業ごとに専有型のクラウドサーバーを提供します。また、クラウドサーバーへの接続はインターネットではなく企業向けの閉域網接続のみで行い、ネットワークのセキュリティも確保します。
さらに、クラウドサーバー上のファイルを一定期間で自動削除する機能も備えています。
<サービス提供イメージ>
3.提供開始日
2019年4月8日
4.利用料金
初期費用 | :100,000円(税抜) |
月額利用料 | :250,000円(税抜)から |
- 月額利用料はご利用形態などによって異なるため、詳しくはNTT Com営業担当者までお問い合わせください。
- 閉域網接続を行うため、別途NTT Comの企業向けVPNサービス「Arcstar Universal One」のご契約が必要となります。
(参考)「COTOHA® API」とは
NTT Comが2018年9月より提供している、AIによる自然言語解析APIです。NTTグループが40年以上にわたって蓄積・精錬した210万語を超える日本語辞書およびAI関連技術「corevo®(コレボ)」と、NTT Comが独自開発した自然言語解析技術を実装しています。
構文解析/固有表現抽出/照応解析/キーワード抽出/類似度算出/文タイプ判定/感情分析/ユーザー属性推定(β版)/言い淀み除去(β版)/音声認識誤り検知(β版) /音声認識誤り修正(β版)/音声認識のAPIを提供しています。また、今後も順次ラインアップを強化していく予定です。
※1: 「corevo®」は、日本電信電話株式会社の登録商標です。http://www.ntt.co.jp/corevo/
※2: 音響モデルとは、認識する音声の周波数特性から音素を特定する際に用いるアルゴリズムのことです。
※3: 発話区間検出技術とは、人間の声以外の雑音を含む音声データの中から、人間が話している部分のみを検出する技術のことです。
※4: 国際技術評価イベント(CHiME-3)で世界1位の精度を達成した技術を利用しています。詳細は、下記日本電信電話株式会社の報道発表資料をご参照ください。なお認識率は音声認識を実施する条件により異なるため、サービスをご利用の際には、当該資料と同等の認識率とならない場合があります。http://www.ntt.co.jp/news2015/1512/151214a.html
本件に関するお問い合わせ先
2019-R026