docomo business Watch

DXの課題を解決するヒントをお届け

docomo business Watchはドコモビジネスが運営しています。

IT用語集

RAG(検索拡張生成)とは

RAG(Retrieval-Augmented Generation)は、生成AIが大規模言語モデル(LLM)の能力を向上させるための重要な技術です。検索(Retrieval)と生成(Generation)を組み合わせたこのアーキテクチャは、自然言語処理モデルの可能性を大きく広げます。現在、AI研究者によって活発に研究が進められており、特に情報の正確性や最新性を向上させるための鍵として注目されています。RAGは、学習データに加え、社内文書などの外部データからの検索結果を組み合わせて回答を生成します。この技術により、より正確で信頼性の高い最新情報を含む回答が可能となり、生成AIの応用範囲を大幅に拡大することが期待されています。

AIの進化を支える最新技術、RAG(Retrieval-Augmented Generation、検索拡張生成)の特徴

従来の生成AIは、LLMの学習データにもとづいて回答を生成します。しかし、LLMの知識は過去の学習データに限定されるため、必ずしも正確な回答を生成できるとは限りません。また、学習データが経時劣化すると、最新の情報が反映されない回答を生成してしまう可能性もあります。

RAGは、このような課題を解決するために、外部のデータと連携します。ユーザーからの質問やタスクを受け取ると、まず関連する情報を外部のデータから検索、そして検索された情報とユーザーのプロンプトをもとに、LLMが回答を生成します。

RAGと従来のLLMの違い

  従来のLLM RAG
知識の更新 学習時点で固定、ファインチューニング(追加学習)やトランスーファーラーニング(転移学習)が必要 リアルタイムで外部情報を取得できるため、最新の情報を反映
誤情報の発生 事実に基づかない情報を生成する現象(ハルシネーション)が発生しやすい 参照情報を元にするため正確性が向上
専門的な回答 限定的 企業のナレッジベースや専門分野のデータと連携させることで、専門性が向上

RAGの登場で生成AIのカスタマイズが劇的に変化

これまで自社の業務に特化した生成AIを構築するには、既存の学習済みモデルに独自の学習を追加で行う「ファインチューニング(追加学習)」や、既存の学習済みモデルを特定の業務やユースケース向けにカスタマイズする「トランスファーラーニング(転移学習)」といった工程が必要でした。これらの手法は、時間とコストがかかるだけでなく、専門知識も必要とされていました。

しかし、RAGの登場により、学習し直すことなく、必要な情報をリアルタイムで検索し、最新の情報にもとづいた正確な回答を生成できるようになりました。

RAGの仕組み

具体的には、ユーザーからの質問やタスクを受け取ると、まず関連する情報を外部の知識ベースから検索します。そして、検索された情報とユーザーのプロンプトをもとに、LLMが回答を生成します。

RAGの仕組みは、主に以下の3つのフェーズで構成されます。

検索(Retrieval)フェーズ

ユーザーからのプロンプト(質問やタスク)を受け取ると、RAGシステムはまずLLMを用いて、プロンプトに関連する情報を外部の知識ベース(データベースやドキュメント)から検索します。検索された情報は、プロンプトとの関連性にもとづいてランキングされ、上位の関連情報が次のフェーズに渡されます。

拡張(Augmentation)フェーズ

次に、検索フェーズで得られた関連情報と、ユーザーが入力したプロンプトを組み合わせ、LLMが回答を生成する際に利用できる形式に加工します。この段階では、関連情報の構造化や要約、プロンプトへの追加などが行われ、LLMがより理解しやすい形で情報が提供されます。

生成(Generation)フェーズ

拡張フェーズで加工された情報をもとに、LLMが質問やタスクに対する回答を生成します。LLMは、自身の学習データに加えて、外部データから得られた最新情報を考慮して回答を生成するため、より正確で信頼性の高い情報を提供することができます。

RAGの回答作成フロー
図:RAGの回答作成フロー

RAGの強みと活用例

RAGの最大の強みは、LLMの知識の限界を補い、常に最新かつ正確な情報にもとづいた回答を生成できることです。これにより、生成AIはより信頼性の高い情報源として、様々な分野で活用されることが期待されます。

RAGの活用例

例えば、カスタマーサポートにおいては、RAGを活用することで、製品に関する最新情報やFAQを迅速かつ正確に提供することができます。また、医療分野においては、最新の研究論文や臨床データを参照しながら、患者の症状に合わせた最適な治療法を提案することができます。

また、回答に使用した文書の情報を付加したり、追加の関連文書を提示したりといったことが可能になります。これにより、生成AIがもっともらしい嘘情報を事実のごとく回答する現象(ハルシネーション)の検証が容易になるとともに、追加の関連文書を活用してさらに回答の精度を高めることが可能です。

また、検索に使用する外部データとしては、就業規則、顧客からの問い合わせに対応するためのFAQ、業務マニュアルなどの社内文書を活用するケースが考えられます。こうした信用性の高い文書を指定することで、一般的な質問ではない、社内事情に関連する質問に対しても正しい回答を生成することができます。

さらに文書を入れ替えるだけで常に最新の情報を取り込んだ文書を生成することもできます。
具体的には、チャットボットによる顧客問い合わせの精度の向上、業務フェーズや最新情報に応じたリアルタイムでの対応策の支援などに活用できます。

RAGの活用例

検索エンジン強化 検索エンジンにRAGを組み込むことで、ユーザーが求める情報をより正確に提示
カスタマーサポート FAQデータと連携し、チャットボットが最適な回答を自動生成
医療・法律分野 診療ガイドラインや法令データを活用し、専門家向けの助言を提供
企業のナレッジ管理 社内ドキュメントを検索、従業員が必要な情報を即座に取得できる環境を構築

また、LLMによる追加の学習を行う必要がないことも強みです。LLM自体を再学習する必要がないため、知識の更新を効率的に行うことも強みと言えます。

生成AIで企業のセキュリティ運用を支援する、AI Advisor

RAGを活用し、企業のセキュリティ運用を効率化・高度化するサービスが提供され始めています。

ドコモビジネスでは、生成AIを活用したセキュリティ運用支援ソリューション「AI Advisor」を開発し、提供を開始しました。「AI Advisor」は、自然言語での問い合わせに対応できるため、専門知識がなくても気軽に利用できます。企業のシステム構成情報や契約書などの独自データを学習するだけでなく、NTT Comが長年培ってきたセキュリティ運用のノウハウも学習することで、高度なアドバイスを提供します。

AI Advisorが実現できる機能例(セキュリティ/IT運用に関する技術サポートの場合)

操作手順などの運用サポート 脆弱性や障害対策の実施方法、会社規定に合わせた周知方法が可能に
質問候補の生成 次に何をすべきか質問候補を提示し、経験の少ない運用者をサポート
脆弱性診断 脆弱性の内容提供や自社の構成情報をもとに影響の有無を明確にする
セキュリティ対策相談 生成AIに自社のセキュリティ対策に関する相談が可能
レポート作成 セキュリティ対策を実施後、調べた内容をもとにレポートを作成
参考:NTTコミュニケーションズ「生成AIを活用したセキュリティ運用支援ソリューション「AI Advisor」を開発」、「生成AIを活用したセキュリティ運用支援ソリューション「AI Advisor」を開発、企業のセキュリティ運用の効率化、今後の運用について紹介

サイバー攻撃の高度化やセキュリティ人材不足といった課題に対応し、企業のセキュリティ運用を効率化・高度化します。

IT用語集一覧

50音順で探す

アルファベット順で探す

IT用語に興味がある方におすすめ!
ビジネストレンドから無料セミナー情報まで盛りだくさんの
メールマガジン(無料)を登録しませんか?

  • 最新のビジネストレンド
    おすすめの深堀記事を
    お手元にお届けします

  • ベストプラクティスに基づく
    導入事例を詳しくご紹介します

  • ドコモビジネス主催の
    オンラインセミナーや
    イベントをご案内します

\ご登録は1分で完了/

ドコモビジネスでは、オンラインでのご相談や
全国のドコモショップでのご相談も可能です

検索