いまさら聞けない「RAG」とは？AIが社内資料を参考に答える仕組み

この記事でわかること

RAGという言葉の意味
なぜRAGが注目されているのか
身近なツールでRAGが使われている例

RAGの考え方を理解すると、社内資料をNotebookLMに読み込ませるだけで、AIが根拠を示しながら社内向けの質問に答えてくれる状態を作れます。

ChatGPTやClaudeに自社のことを質問すると、もっともらしい答えが返ってくることがあります。しかし、よく確認すると、実際の内容と違っている場合があります。

生成AIは、知らないことについても、それらしい文章を作ってしまうことがあります。この現象は「ハルシネーション」と呼ばれます。

こうした問題を減らすために使われる仕組みの一つが「RAG（ラグ）」です。この記事では、RAGとは何か、どのような場面で使われているのかを整理します。

RAGとは何か

RAGは「Retrieval-Augmented Generation」の略です。日本語では「検索拡張生成」と訳されることがあります。読み方は「ラグ」が一般的です。

言葉を分けると、次の3つの意味になります。

Retrieval：検索
Augmented：補強された
Generation：生成

簡単に言うと、RAGは「AIが答える前に、関連する資料を探し、その資料を参考に回答を作る仕組み」です。

この考え方は、2020年に当時のFacebook AI Research、現在のMetaの研究者が発表した論文で提唱されました。その後、生成AIを業務で使う場面が増えるなかで、よく使われる仕組みの一つになっています。

ここで思い出したいのが、冒頭で触れたハルシネーションです。ChatGPTやClaudeのような生成AIは、もともと学習した情報をもとに回答を作るため、自社の社内資料や最新の会議内容、個別の商品マニュアルなど、学習に含まれていない情報については答えるための材料を持っていません。それでもAIは、知っている範囲の情報を使って、それらしい答えを作ってしまうことがあります。

RAGは、この弱点を補うための仕組みです。質問されるたびに、こちらが登録しておいた資料の中から関連する部分を探し出し、その内容をもとに回答を作るので、AIがもともと知らない情報についても、資料に書いてあれば答えられるようになります。

RAGがあると何が変わるか

RAGを使うと、AIに次のような質問をしやすくなります。

たとえば、社内規定を読み込ませておき、「うちの会社の出張旅費の上限はいくらですか」と聞く。過去の議事録をもとに、「去年の取引先との打ち合わせで、納期について何を決めましたか」と聞く。商品マニュアルを参照させて、お客様からの問い合わせに対する回答案を作る。

これらは、AIが事前に学習している知識だけでは正確に答えにくい質問です。RAGを使うと、こうした業務上の質問にも対応しやすくなります。具体的なメリットは、主に2つあります。

1つ目は、ハルシネーションを減らしやすいことです。AIが資料を見ずに答えると、もっともらしい間違いが混ざることがあります。RAGでは、探してきた資料を参考に回答するため、根拠のない回答を減らしやすくなります。

2つ目は、最新の情報を扱いやすいことです。参照する資料を更新すれば、AIが答えるときの材料も新しくなります。たとえば、就業規則が改定されたときは、新しい規則のファイルを入れ替えるだけで、AIの回答もそれに合ったものに切り替わります。

RAGの仕組みを3つのステップで見る

RAGでは、質問を受けてから回答するまでに、主に3つの動きがあります。

まず、AIが質問の内容を読み取ります。たとえば「うちの会社の出張旅費の上限は？」と入力されると、出張旅費に関する質問だと判断します。

次に、関連する資料を探します。あらかじめ登録してある社内資料の中から、出張旅費に関係する部分を探します。

最後に、見つけた資料を参考に回答を作ります。たとえば、資料に「出張旅費の上限は1日あたり○円」と書かれていれば、その内容をもとに答えます。

大事なのは、AIが自分の知識だけで答えるのではなく、探してきた資料をもとに答えることです。そのため、社内資料やマニュアルに基づいた回答を作りやすくなります。

身近な例：NotebookLM

普段の業務でRAGに近い仕組みを使いやすいツールとして、GoogleのNotebookLMがあります。

NotebookLMは、PDF、議事録、Webページなどを読み込ませると、その内容をもとに質問へ答えてくれるサービスです。自分でアップロードした資料をもとに回答するため、RAGの考え方を体験しやすいツールです。詳しい使い方はいまさら聞けない「NotebookLM」とは？で扱っています。

RAGを試してみたいと思ったら、NotebookLMから始めるのが分かりやすい第一歩です。専門的なシステムを作らなくても、資料をアップロードして質問するだけで、RAGの考え方を体験できます。

まとめ

RAGは、AIが答える前に関連する資料を探し、その資料を参考に回答を作る仕組みです。

一般的な生成AIが学習済みの知識だけをもとに回答するのに対して、RAGはこちらが用意した資料を参照しながら回答します。この違いがあるおかげで、生成AIに頼める仕事の幅が広がります。

最初の一歩としては、自社のPDFや議事録を1つNotebookLMに読み込ませて、質問してみるところから始めるとよいでしょう。回答に資料の引用元が示される様子を見ると、RAGの考え方がぐっと身近に感じられます。

Q&A

Q. RAGを使うには、専門のエンジニアが必要ですか？

NotebookLMのように、すでにRAGに近い仕組みが入っているツールを使うだけなら、専門のエンジニアは不要です。ファイルをアップロードして質問するだけで使えます。

一方、自社の業務システムにRAGを組み込んで本格的に運用する段階になると、エンジニアや外部の専門家に相談した方が安全です。身近なツールから試して、必要が見えてきたタイミングで専門家に相談するのが、無理のない進め方です。

Q. RAGを使えば、AIの間違いはなくなりますか？

完全になくなるわけではありません。

RAGは、AIが探してきた資料を参考に答える仕組みなので、何も見ずに答える場合よりも、根拠のない間違いは減らしやすくなります。ただし、参照した資料が古い場合や、質問とずれた資料をもとにしてしまった場合は、回答も間違うことがあります。

そのため、出てきた回答を鵜呑みにせず、参照元の資料に立ち戻って確かめる手間は残ります。

Q. 自社の機密資料をRAGに使っても大丈夫ですか？

使うツールやサービスによって、データの扱いは異なります。

アップロードした資料がAIモデルの学習に使われるのか、外部に送信されるのか、保存期間はどうなっているのかは、利用するサービスの規約や管理設定を確認する必要があります。

法人向けサービスの中には、入力した資料を学習に使わないと明示しているものもあります。会社で使う場合は、どの資料を使ってよいか、どの情報は入れてはいけないかを社内ルールとして決めておくと安心です。詳しくは中小企業のためのAIセキュリティ完全ガイドも参考になります。