生成AIとは?メリット・デメリットやLLMをわかりやすく解説 イメージ

生成AIとは?メリット・デメリットやLLMをわかりやすく解説

MENU

生成AI(Generative AI)は、テキスト、画像、音声、動画など多様なコンテンツを生成するAI技術です。2022年に登場したChatGPTやStable Diffusionを契機に注目を集め、ビジネスや日常生活で幅広く活用されています。本記事では、生成AIの仕組みや特長、活用例、メリット・デメリットをわかりやすく解説します。さらに、LLMの役割や生成AIを効果的に活用するためのヒントも紹介します。ぜひ参考にしてください。

1.生成AIとは

生成AI(Generative AI)とは、テキスト・画像・動画・音声といった、多様な形式のコンテンツを新たに生成する能力を持つ人工知能の一種のことです。この技術は、大量のデータセットを生成AIが自ら学習し、パターンや関連性を深く学習するディープラーニング(深層学習)という高度な機械学習に支えられています。生成AIがデータ内に存在する複雑な特徴や傾向を抽出し、これまで存在しなかった新しい内容を作ることが可能です。

生成AIの操作において重要なのは、プロンプトと呼ばれる入力指示です。プロンプトは、ユーザーが生成AIに対して何を求めているのかを示す質問や命令であり、生成AIはプロンプトにもとづいて出力を行います。

ただし、曖昧で具体性に欠けるプロンプトを入力した場合、目的と異なる結果が得られることもあるでしょう。一方で、明確かつ詳細なプロンプトを入力することで、より正確で信頼性の高いアウトプットを作成することが可能です。

①生成AIのこれまでにない特徴とは

2022年にChatGPTが公表されたことをきっかけに、生成AIは急速に注目を集めるようになりました。一方で、AI(人工知能)そのものの研究は長年にわたり進められてきた歴史があります。生成AIのこれまでにない特徴は、「より自然で創造的な新規コンテンツを高精度に生成できる」という点です。

従来のAIは、膨大なデータをもとに学習し、入力された質問や課題に対して、過去のデータを利用して最適な回答を予測する仕組みです。主にビジネスシーンなどで、手書きされた書類のデータ化や定型的な業務の自動化など、既存のデータを活用した反復的なタスクの効率化に利用されています。

一方で、生成AIは、既存の情報を活用するだけでなく、新しいコンテンツを高精度に生み出すことも可能です。たとえば、ビジネス用メールの文面作成、会議の議事録の要約、広告やプロモーションで使用する画像の生成といったクリエイティブな作業にも対応可能です。

生成AIによる成果物に人間が加筆・修正やブラッシュアップを行うことで、さらに質の高いコンテンツへと昇華させることもできるでしょう。

2.国内企業における生成AIの利用状況

ここで2024年3月の総務省の資料を参考に、国内企業における生成AIの利用状況を見てみましょう。

図表 3-117 生成AIの活用方針(国別)
出典:
国内外における最新の情報通信技術の研究開発及びデジタル活用の動向に関する調査研究の請負成果報告書|総務省

「積極的に活用する方針である」「活用する領域を限定して利用する方針である」と回答した割合の合計は、日本では約4割にとどまりました。この数字は、生成AIの活用方針を定めている企業が8割以上に達するアメリカやドイツ、中国と比較して約半分程度の割合であり、日本企業が生成AIの導入に慎重であることを示しています。

また、生成AIの活用状況では、日本企業の4割以上がすでにメールや議事録、資料作成などの「業務で使用中」と回答しており、「トライアル中」を含めると6割以上に達しています。生成AIの効果については、日本国内企業の約7割以上が「業務効率化や人員不足の解消につながる」と回答。さらに「斬新なアイデアの創出や新たなイノベーションが生まれる」と期待する声も挙げられました。

懸念事項としては、セキュリティリスクや著作権侵害の問題が挙げられており、これらが日本企業の生成AI導入を慎重に進める一因となっているとも考えられます。今後、日本企業が他国に追随して生成AIの活用を拡大していくには、リスク管理体制の強化や法的な枠組みの整備が重要な課題となるでしょう。

3.生成AIが注目される理由

3.生成AIが注目される理由 イメージ

次に、近年になって生成AIが注目されはじめた理由について詳しく紹介します。

①高精度で自然なコンテンツを生み出せる

生成AIは、入力されたプロンプトに応じて、人間が作成したかのような自然な文章や写真のように精巧で美しい画像など、高精度で自然なコンテンツを生み出すことが可能です。その用途は多岐にわたり、企画のアイデア出しやデータにもとづく迅速な意思決定の支援、プレゼンテーション資料や報告書の作成など、幅広い業務を効率化するツールとしても活用されています。

生成AIが質の高いコンテンツを生成できる理由は、コンピューターの処理能力やメモリ容量の飛躍的向上があったからです。このことにより、複雑な計算や大規模なデータの処理を可能にしました。

また、パラメータ数が向上したことも生成AIが質の高いコンテンツを生み出す理由の1つです。パラメータとは、生成AIがデータを学習する際に、正確な結果を出せるようにする調整可能な変数のことです。最近の生成AIモデルでは、数十億から数兆におよぶパラメータが導入されており、より高度で自然なコンテンツを出力できるようになりました。

②誰でも使いやすい

生成AIが社会に急速に普及し、注目されるようになった背景には、その使いやすさが大きく寄与しています。従来のAIは、利用するために高度なスキルや専門知識が求められ、操作には一定の学習が必要でした。また、特定の用途に限定されているものが多く、初めて使用する際にはマニュアルを参照しながら手順を確認しなければならないなど、ハードルが高かったといえます。

これに対して、生成AIは専門的な知識がなくても直感的に操作できる設計で、そのシンプルさが多くの人々に受け入れられる理由の1つとなっています。たとえば、ChatGPTのようなテキスト生成AIは、自然な会話形式で応答を生成するため、質問や指示を入力するだけで簡単に利用できます。従来のAIでは利用が難しかった人々にも技術が広がり、業務以外の用途でも幅広く活用されるようになりました。

4.生成AIの主な種類

生成AIには主に4つの種類があります。各生成AIの特長を見ていきましょう。

①テキスト生成AI

テキスト生成AIでは、ユーザーが入力するテキストベースのプロンプトを入力すると、その内容にもとづいて適切なテキストが素早く生成されます。その用途は幅広く、Eメールやプレスリリース、営業資料やSNSの投稿文、翻訳などを自然な言葉遣いで生成できます。これまで時間がかかっていた文章作成の業務が大幅に効率化されるだけでなく、クオリティの高いアウトプットを簡単に出力することも可能です。

②画像生成AI

画像生成AIは、プロンプトとしてテキストや画像を入力することで、新しい画像を生成できます。単にゼロから理想とする画像を作り出すだけではありません。たとえば、既存の画像の一部を修正したり、不足している部分を補完して完全な画像に仕上げたりすることも可能です。

また、手描きのラフスケッチをプロンプトとして入力し、テキストで指示を追加することで、理想的なイメージへと具体化することもできます。これにより、抽象的なアイデアをビジュアル化するプロセスがより簡単になります。

③動画生成AI

動画生成AIは、テキストや画像、音楽から新たな動画を生成する点が特長です。中には、ニュースやブログ記事などのURLを入力するだけで、その内容をもとに動画を作成する生成AIサービスも存在します。

動画コンテンツは、多くの情報を効率的に伝えられるだけでなく、人の記憶にも残りやすいといわれています。制作には多くの手間と時間がかかりますが、動画生成AIを活用すれば、動画に必要な字幕や音声、さらにはアバターまでも自動生成可能です。その結果、編集作業の負担を大幅に軽減することが期待されます。

④音声生成AI

音声生成AIは、テキストを入力するだけで、その内容を読み上げる音声を生成します。声の種類を選べるだけでなく、感情を反映した喜怒哀楽をつけることも可能です。

この技術を活用すれば、音声対応のチャットボットやオーディオブックの読み上げ、トレーニング教材の音声作成や商品説明、館内アナウンスなど、多種多様な用途に適した音声を手軽に制作できます。手間を省きながらも、高品質な音声コンテンツの提供が実現するでしょう。

5.テキスト生成AIを支えるLLM
(大規模言語モデル)とは

テキスト生成AIの代表例として知られるChatGPTの基盤技術を支えているのが、LLM(大規模言語モデル)です。ここでは、特に企業での業務利用が多いテキスト生成AIを支えるLLMの例について見ていきましょう。

①代表的なLLMの例

代表的なLLMの例として、Google社の「Gemini」、OpenAI社の「GPT」、Anthropic社の「Claude」、国内からはNTTグループの「tsuzumi」が挙げられます。それぞれの概要を以下の表にまとめました。

LLMの代表例 概要
Google社
「Gemini」
以前は「Bard」という名称で、2024年2月に名称変更された。Bardよりも、詳細なプロンプトへの対応や論理的思考、複雑なコーディングなどに優れている。Googleの幅広いAI技術を統合し、マルチモーダル機能を備えているため、テキストだけでなく、画像や音声など複数の形式のデータを理解し処理することが可能。
OpenAI社
「GPT」
GPT(Generative Pre-trained Transformer)は、大規模なデータセットを事前学習した汎用的な言語モデル。ユーザーとの高精度な対話をサポートする。GPT-3.5やGPT-4、GPT-4oなど、さまざまな種類がある。GPT-4oは、テキストだけでなく、画像や音声も扱えるマルチモーダルモデルとして注目された。
Anthropic社
「Claude」
OpenAIの元社員によって開発され、日本語に対応しながら自然な対話が可能な設計となっている。特に長文データの処理に優れ、文章の読み取りや要約、編集、翻訳を高速に行うことができる。また、APIを通じて外部ツールやシステムとの連携が容易であり、ビジネス用途から個人利用まで幅広い場面で活用可能。
NTTグループ
「tsuzumi」
他のLLMと比べて小型モデルながら、非常に高い日本語処理性能を持つ。単にパラメータサイズを増やすのではなく、日本語学習データの質と量を向上させることで、軽量でありながら高い性能を実現している。特定の業界や分野で使われる専門的な表現や知識に対応するチューニングを効率的に行える設計で、カスタマイズのコストを抑えながらも実用性を高めている。

Googleの「Gemini」はマルチモーダル処理と既存のGoogle製品との統合、OpenAI社の「GPT」は高精度の自然言語処理、Anthropic社の「Claude」は安全性と倫理性、NTTグループの「tsuzumi」は世界トップクラスの日本語処理性能や高い実用性が強みです。LLMは各社の技術力を集結させ、それぞれ独自の特長を持ちながら発展を続けています。

6.生成AIを企業が利用するメリット

6.生成AIを企業が利用するメリット イメージ

生成AIを企業が利用するメリットについて、企業の業務効率化やアイデア創出にどのように貢献するのかを考えてみましょう。

①業務効率化につながる

企業で生成AIを活用することで、業務効率化につながることが期待されます。たとえば、メール作成に利用すると時短になるだけでなく、誤字脱字の防止やわかりやすい文章の作成にも役立ちます。メール作成が苦手な人でも、生成AIが出力した内容をたたき台として、ビジネスメールを効率的に作成できるでしょう。

また、議事録作成や要約、社内規定やリーガルチェックなど、あらゆる業界における共通したアナログ業務の自動化や効率化に役立ちます。それぞれの業界知識や社内ドキュメントを学習した特化型LLMと組み合わせることで、業界独自の業務知識を把握した上での対応が可能になります。

コンタクトセンターのオペレーター業務についても、リアルタイム検索・自動要約・情報抽出が可能なため、お客さまの待ち時間を削減し、品質対応の向上が実現できるでしょう。また、通話対応後の要約作成やQ&A資料などのナレッジ作成などが自動化されるため、アフターコールワークの稼働時間の削減が図れます。このようなナレッジデータから、オペレーターに対して最適なアドバイスがなされるため、お客さま対応の品質向上にも貢献できるでしょう。

②アイデアを創出できる

生成AIは、新規事業のアイデアを効率よく出すための強力なツールになるでしょう。たとえば、プロンプトに「〇〇業界で注目されるトレンドを活用した新規事業案の提案」などの指示を入力すると、生成AIは市場データや業界の動向にもとづき、具体的かつ斬新なアイデアをいくつも提示します。

また生成AIは、クリエイティブな分野でも活用が期待できます。具体的には、新商品のイメージ画像や広告用のビジュアルをゼロから作成する際、生成AIにプロンプトを入力するだけで、アイデアの叩き台となる画像を短時間で生成できます。動画編集では、生成AIが動画のストーリーボードや構成案を作成したり、プロモーション動画のテンプレートを提案したりすることが可能です。

7.生成AIを企業が利用する
デメリット・課題

前段では生成AIを活用することで生まれるメリットについて解説しました。次に、生成AIを企業が利用するデメリットと課題についても紹介していきます。

①ハルシネーションが起こる可能性がある

生成AIを企業で活用する際には、「ハルシネーション(幻覚)」と呼ばれる問題に注意することが必要になります。ハルシネーションとは、生成AIが事実と異なる情報や、文脈にそぐわない内容を出力してしまう現象です。

具体例として、生成AIに業務で使用するニュース記事の要約を依頼したとしましょう。生成AIが記事に存在しない情報を追加したり、誤った事実の要約を出力したりした場合、誤った情報がそのまま業務に利用されると、ビジネス上の信頼性を損なう可能性があります。

生成AIを活用する際には、具体的で明確なプロンプトを作成し、生成AIが生成した内容を鵜呑みにするのではなく、必ず人が確認して信頼できる情報かどうかをチェックすることが重要です。

②LLMの学習で消費する電力量が大きい

大規模言語モデル(LLM)は、高い精度を誇る一方で、運用には多くの課題が伴います。その1つが、学習に必要な膨大な電力消費です。たとえばGPT-3では、1回の学習に約1,300MWhもの電力が使用され、これは原子力発電所1基が1時間で発電する量に匹敵するとの試算があります。電力消費によりCO2排出量が膨大になる恐れがあり、環境への大きな負荷が懸念されています。

③企業で利用するにはファインチューニングが必要になることも

企業で大規模言語モデル(LLM)を効果的に活用するためには、ファインチューニングが必要になる場合もあります。ファインチューニングとは、あらかじめ学習済みのモデルに対し、特定のタスクに関連するデータセットを用いて再学習させ、モデルを特定の用途に合わせて微調整することです。この手法により、モデルの応答や出力をより精度の高いものに仕上げることが可能になります。

たとえば、専門用語や特定の業界で使用される固有のデータをモデルに取り込めば、業界の特定の文脈や背景を理解し、より正確で有用な回答を提供できるようになります。ファインチューニングは、LLMを一般的な知識に対応したツールから、企業のニーズに合った実践的なソリューションへと変える重要なステップになるでしょう。

④機密性の高い業務データを生成AIで扱うのにセキュリティ的な懸念がある

生成AIは主にオープンデータを学習しているため、企業固有の業務にそのまま適用するのは難しい場合があります。そのため、企業独自のデータを学習させる必要のある状況が少なくありません。

しかし、社内データを生成AIに学習させるために、データをクラウド環境にアップロードする必要がある場合、セキュリティ上の懸念になるでしょう。特に、機密情報や顧客情報などの取り扱いに厳しい制約がある企業では、このプロセスが自社のセキュリティポリシーに違反する可能性もあるからです。

実際、多くの企業からは、「クローズドかつセキュアな環境で自社データを学習させたい」という要望が上がっています。このような環境であれば、機密情報が外部に漏れるリスクを抑えつつ、企業独自の知識をモデルに反映させることが可能です。

8.NTTコミュニケーションズが提供する
NTTグループ独自のLLM「tsuzumi」と
関連ソリューション

NTTコミュニケーションズは、GPTやGemini、LLaMAといった大規模言語モデル(LLM)だけでなく、NTTグループが独自開発したLLM「tsuzumi」を提供しています。ユースケースに合わせ最適な提案をしており、中でも「tsuzumi」の特長として以下の4つが挙げられます。

  • 軽量性
  • 高い言語性能
  • 高カスタマイズ性
  • マルチモーダル性

まず、軽量性について、tsuzumiのパラメータサイズは7B(70億)であり、GPT-3(175B)の約25分の1という非常にコンパクトな設計となっています。モデルの小型化により、NTTグループが提供するプライベートクラウドや企業のオンプレミス環境でも利用が可能です。企業はデータを社外に出す必要がなく、機密情報を安全に取り扱うことができます。さらに、小型モデルであるため、省電力化を実現し、環境負荷も軽減されています。

2番目の特長は、高い言語性能についてです。NTT研究所が約40年間にわたり蓄積してきた言語処理技術を活用することで、パラメータサイズが小さいにもかかわらず、日本語処理において世界トップレベルの性能を発揮します。

3番目の特長として、高いカスタマイズ性が挙げられます。業界特有の専門知識を再学習させ、最新の情報にもとづいてアップデートを行うなどチューニング作業が必要な場合、アダプターを用いて必要な知識を少ない追加学習量で柔軟に組み込むことが可能です。

さらに、マルチモーダル性にも優れています。tsuzumiはテキスト情報だけでなく、視覚や聴覚といった非言語的なデータも処理可能です。たとえば、グラフが入力情報として与えられた場合、それをもとにテキストでわかりやすい回答を生成できます。このように複数のデータ形式に対応することで、より幅広い業務シーンでの活用が期待されます。

またtsuzumiは、次に紹介する3種類のソリューションでも利用可能です。

①CXソリューション

①CXソリューション 図

生成AIを活用したソリューションは、コンタクトセンターや店舗の受付、ECサイトなど、顧客との接点となる場面でのCX(カスタマーエクスペリエンス)の向上に大きな効果を発揮します。その中でも特に、コンタクトセンターのオペレーター業務支援は、生成AIの応用例として注目されています。以下でオペレーター業務支援の仕組みをご紹介します。

たとえば、応対記録から必要な情報を自動抽出・要約することで、オペレーターの業務効率を向上させます。さらに、通話内容をもとにナレッジを抽出し、会話サンプルを生成することで、研修やFAQの質を向上。これにより、業務の時間を削減しつつ、ナレッジの高度化をサポートします。

②EXソリューション

②EXソリューション 図

金融・医療・行政・小売・運輸などの業界を中心に、お客さまの業界、業務に合わせ従業員の生産性向上につながるソリューションを提供します。tsuzumiは、業務マニュアルや社内ドキュメント、用語集、利用ログなどの内部データを使ってファインチューニングを行い、業界や業務に特化したLLMの構築が可能です。この特化型LLMを活用することで、蓄積されたナレッジを効果的に活用し、業務効率化や課題解決を実現します。

さらに、学習させた特化型LLMを効果的に活用する方法として、RAG(Retrieval-Augmented Generation:検索拡張生成)にも対応しています。RAGは欲しい情報を検索して抽出し、その内容をもとに生成AIに回答させる技術です。RAGを組み合わせることで、学習済み情報だけでなく、未学習の社内情報などからも回答を生成することが可能になります。

たとえば、金融・医療・行政など専門性の高い業務には膨大な量のマニュアルが存在しています。従来は人手でマニュアルの中から必要な情報を探していました。RAGを活用することで、生成AIに質問を投げかければマニュアルの中から必要な情報すべてを瞬時に得ることができるようになります。

また、特化型LLMを組み合わせることで、独自の業務ルールや専門用語等も踏まえて回答が生成できるようになり、より業務にフィットした回答が得られるようになります。

③CRXソリューション

③CRXソリューション 図

CRX(Cyber Resilience Transformation)ソリューションとは、サイバー攻撃の被害を最小限に抑えつつ、リモートワークなど柔軟で多様な働き方を安全に導入し、事業の継続性を強化するために設計された包括的なソリューションです。

tsuzumiに企業固有の情報を学習させ、マルウェアの自動検知や分析・対処を行うだけでなく、操作手順の運用サポートやセキュリティ対策診断、脆弱性診断など幅広い支援を提供します。セキュリティ運用の自動化と生成AIによるサポートにより、IT担当者の負荷軽減に大いに貢献するでしょう。

たとえば、マルウェアなどに反応するセキュリティアラートが294件発生した場合、95%となる280件は自動化によって処理が可能ですが、残りの5%は人による対応が残ります。残り5%の対応について、生成AIがアドバイスやサポートを行い、経験の浅いIT担当者でも的確かつ効率的に業務を進められるようになります。

9.まとめ

生成AIは、テキストや画像・音声・動画などを新たに生成する能力を持つ人工知能技術で、Googleの「Gemini」、OpenAIの「GPT」、Anthropicの「Claude」、NTTの「tsuzumi」など多くのモデルが存在します。業務効率化やアイデア創出、クリエイティブ活動支援など、ビジネスや日常生活で幅広く活用されています。

一方で、ハルシネーション(誤情報の出力)やセキュリティリスク、高コストや環境負荷といった課題も残ります。しかし、ChatGPTやGeminiなどのテキスト生成AIや、Stable Diffusionのような画像生成AIがもたらす社会的影響は大きく、課題解決が進めばさらに価値が高まるでしょう。
NTTコミュニケーションズでは、NTTグループが独自開発したLLM「tsuzumi」に加えて、GPTやGeminiも提供しています。それぞれのユースケースに合わせてLLMやRAG、音声認識などを組み合わせ、企業の抱える課題に対して、今までにはない課題解決をご提案いたします。

これから生成AIを活用しようとお考えのご担当者さまや、社内のDXやEX化に悩んでいるご担当者さまは、ぜひ一度NTTコミュニケーションズにお気軽にご相談ください。詳しくは以下からお問い合わせください。

このページのトップへ