
NTTコミュニケーションズ
ビジネスソリューション本部 スマートワールドビジネス部 ジェネレーティブAIタスクフォース
北川 公士

新規ビジネスの創出や社会実装を
目指す事業共創の場です
新システムの開発を通じて、
社会・産業DXの実現を目指していきます
地域社会を支える皆さまと地域課題の解決や
地域経済のさらなる活性化に取り組みます
旬な話題やお役立ち資料などDXの課題を解決するヒントをお届けする記事サイト
課題やニーズに合ったサービスをご紹介し、
中堅中小企業のビジネスをサポート!
モバイル・ICTサービスをオンラインで
相談・申し込みができるバーチャルショップ
NTTコミュニケーションズ(以下、NTT Com)ではお客さまのビジネス課題解決のため、生成AIを用いた技術開発やビジネス活用に積極的に取り組んでいます。今回は、その中でも特に技術開発を担っている、イノベーションセンター テクノロジー部門 Generative AIチームのお二人に、開発中の技術である「rokadoc」「chakoshi」や、チームのカルチャーについて伺いました。
【お話を伺ったGenerative AIチームのお二人】
新井 一博 さん(左)、小川 雄司 さん(右)
── まずはお二人が所属するGenerative AI チームの活動について教えてください。
新井さん: われわれのチームでは、イノベーションセンターの中でも生成AI、特にLLMに関連する研究開発(R&D)を行いつつ、ビジネスチームと連携してR&D活動で得られた知見・技術のプロダクト化にも取り組んでいます。R&Dにとどまらず、ビジネス的な出口まで含めて考えながら仕事をするのが特色かもしれません。
── 現在特に注力している分野を教えてください。
小川さん: ここ数年でLLMのモデルとしての能力は飛躍的に伸びてきて、今までは難しいと思われていた問題がどんどん解けるようになってきています。ただ、実際にビジネス領域でLLMを使おうとすると、LLM自体のモデルの強さだけでは解決できないギャップがあることが分かってきたんです。そこで今は、“LLM単体でできることとビジネスニーズとのギャップを埋めるための技術開発”に注力しています。
新井さん: 具体的には「1. LLMに複雑なドキュメントの情報をうまく扱わせること」「2. LLM運用時の安全性向上」の2つに注力して取り組んでおり、それぞれの課題に対応する新技術「rokadoc」「chakoshi」のパブリックベータ版を無料公開しています。ここでご紹介しますので、ぜひ皆さまに触っていただいて、フィードバックを頂けるとうれしいです。
──まず、rokadocが対応している1つ目の課題領域について詳しく聞かせてください。そもそもどうして複雑なドキュメントをLLMに扱わせたいのでしょうか?
rokadocについて説明する小川さん
小川さん: 例えば、LLMのビジネス応用例として企業内の知識を用いたチャットボットサービスがありますが、このようなサービスを作ろうとすると企業独自のデータをLLMに参照させる必要があります。ただ、社内ドキュメントって表とか図が満載だったりテキストがいろんなところに配置されていたり、Word、Excel、PowerPoint、PDFといったファイル形式も多様ですよね。
── 確かに。1ページにいろんな形式で情報が詰め込まれていますね。社内でも、PowerPointで作成された図表満載の業務マニュアルをよく目にします。
小川さん: そうなんです。そのようなドキュメントは人間には分かりやすいのですが、テキストを読み込むLLMには扱いにくいのです。なので、図表に含まれている情報も漏れなくLLMが読みやすい形式に変換することが重要になります。
── そのような課題に対して「rokadoc」では何が実現できるのでしょうか?
小川さん: rokadocでは、“複雑な構成・ファイル形式を持つドキュメントをLLMが処理しやすいように構造化テキスト(JSON)に変換”することができます。文字列の整形はもちろん、図表の内容もテキストやHTMLの表として表現することで、できるだけ情報を落とすことなくLLMに読み込ませることができます。
rokadocの実行例。図表を含む2段組の論文PDF(左)の情報量を落とさずに構造化テキストに変換できている
── どのようにしてこのようなドキュメント変換を実現しているのですか?
小川さん:文章構造を解析する技術や、図や表の情報をテキストに変換するためにOCRやVision LLMなどの技術要素を複合的に組み合わせたパイプラインを実装しています。それぞれの技術要素の利点を生かしつつ、全体としては破綻がない形でドキュメントを再構成できるように工夫をしています。
── 今後の展望を教えてください。
小川さん:実際にビジネスで使っていただけるように、さらなる精度の改善や変換後のドキュメントの活用まで見据えた周辺機能の強化に取り組んでいます。例えば変換したドキュメントを参照してユーザーの質問に答えるチャット機能(RAG機能)です。このチャット機能はパブリックベータでも試用いただけるのでぜひ使ってみて欲しいです。
■rokadocの詳細およびパブリックベータ版はこちらから
── 次は「chakoshi」について教えてください。こちらはどのような技術なのでしょうか。
新井さん: LLMは質問応答をはじめさまざまなタスクに対応できる柔軟性がある一方で、時には予期せぬ出力や有害な情報を出力してしまうリスクが存在します。そのようなリスクを軽減するために、“LLMの入出力を外部からチェック“して不適切なコンテンツをフィルターする、いわばガードレールのような技術”がchakoshiです。
── 具体的にはどのようなことができるのでしょうか?
chakoshiについて説明する新井さん
新井さん: chakoshiは独自に開発したモデルを使ってLLMの入出力テキストの安全性をチェックします。例えばLLMを用いたチャットボットを開発する際に、LLMの入出力をchakoshiでチェックすることで安全性の低いテキストをフィルターするような使い方を想定しています。このようなサービスはさまざまな企業で開発されていますが、日本語の判定性能が不十分だったり、ビジネスで使う上では検知可能なカテゴリが不十分だったりすることが多いです。
その点chakoshiは、日本語のデータセットを独自に作成・トレーニングに用いることで“高い日本語判定性能”を実現しています。また、ユーザー自身で“検知カテゴリをカスタマイズできる”という特徴を持っています。これにより、ユーザーは自社のビジネスニーズに応じて検知範囲を拡張することができるようになります。
chakoshiの実行例。安全性が低いと思われるテキストを“unsafe”と正しく判定している
── なるほど。ユーザー自身で検知範囲をカスタマイズできればさまざまな用途に対応できそうです。今後もこのような独自の機能を開発していく予定でしょうか?
新井さん: はい。まずはchakoshiもパブリックベータ版を無償公開していますのでぜひ使ってみて、フィードバックを頂けるとうれしいです。それも参考に、今後の機能を追加していく予定です。一方でLLMの利用方法が多様化しているため、より多様な形態の安全性担保に対応していくのが重要だと考えています。
■chakoshiの詳細およびパブリックベータ版はこちらから
── 最後に今のチームについて教えてください。まずお二人はどのような経緯で今のチームに所属されているのでしょうか?
小川さん: 私は2023年にNTT Comに中途入社しました。LLMの研究開発をやりたかったので、ハイスペックGPUが必要なだけ使える環境は魅力に感じましたね。また、リモートワーク主体で働くことができるのが自分に合っていると思います。
── 原則リモートワークだとチームのコミュニケーションはどうされているのでしょうか?
小川さん: チーム内ではSlackのチャットやhuddle(Slackの通話機能)を使ってかなり活発にやり取りしています。チーム開発なのでやはりチーム内で意思統一を図るのが重要なのですが、ちょっとしたことで気軽にコールする文化が出来上がっているので、リモートワークで不便を感じることはないです。あとはチーム全体で2週に1回出社するタイミングを設けているので、そのタイミングをうまく活用しています。
── 新井さんはいかがでしょうか?
新井さん: 私も2023年に中途入社しました。入社前にチームリーダーとカジュアル面談をしたのですが、その際にNTT Comの中ですごく技術的に尖ったことをやっている組織があると知って入社を決めました。入社してから改めて実感しますが、イノベーションセンター内には本当にさまざまな技術分野を扱うチームがあります。業務上関わるところだけでも、GPU計算クラスタなどのインフラを作るチーム、クラウドプラットフォームの専門チーム、セキュリティのチーム、デザインチームなどです。自分たちの技術をプロダクトとして実装するにあたって、同じ部署内のいろんな分野のプロフェッショナルと連携してスピーディーに開発を進めることができるのは、イノベーションセンターならではの面白さだと思いますね。
── なるほど。それだけ幅広いエンジニアが集まってどんどん実装を進められるのは楽しそうですね。
小川さん: そうですね。実はイノベーションセンターで掲げている組織のバリューの一つに"Implement First"というものがあるのですが、私はこれが気に入っています。結局研究レベルで面白くても、実際の社会で役に立つかはプロダクトという形で実装してみて使ってもらわないと分からないので、まず実装してみて仮説検証していくという姿勢が組織レベルで根付いているのが良いところだと思いますね。
・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・
お二人が所属するNTT Com イノベーションセンター テクノロジー部門 Generative AIチームでは、一緒に働く仲間を募集しています。興味のある方はカジュアル面談を実施しておりますので、ぜひお気軽にご連絡ください!
■担当者(連絡先):イノベーションセンター テクノロジー部門 岩瀬義昌(yoshimasa.iwase@ntt.com)
※募集は2025年度内を予定していますが、予告なく終了する場合があります。
Generative AI チームのエンジニアメンバーの皆さん
NTTコミュニケーションズイノベーションセンター テクノロジー部門 Generative AI PJ
深山 健司
NTT Com イノベーションセンターにてLLMの安全な社会実装をめざした技術検証・開発に従事。特に直近では日本語LLM向けガードレール技術“chakoshi”のプロダクトマネジメント & インフラエンジニアとして活動中。
NTTコミュニケーションズ
ビジネスソリューション本部 スマートワールドビジネス部 ジェネレーティブAIタスクフォース
北川 公士
NTTコミュニケーションズ
イノベーションセンター プロデュース部門
斉藤 久美子
NTTコミュニケーションズ
イノベーションセンター 技術戦略部門
森岡 康高
お問い合わせ
NTT Comでは、いつでもご連絡をお待ちしています。
ご用件に合わせて、下記の担当窓口からお問い合わせください。