この記事でわかること
この記事では、生成AIの弱点を補う重要な仕組みである RAG(Retrieval-Augmented Generation) について解説します。
RAGとは何か、なぜ必要なのか、どのように動いているのかを理解することで、 生成AIを「実務で安全に使うための考え方」が身につきます。 AI-900試験対策としても必須の内容です。
RAGとは何の略か
RAGは、
Retrieval-Augmented Generation
の略です。
日本語では、「検索拡張生成」と訳されます。
つまり、 情報を検索してから文章を生成する という仕組みです。
なぜRAGが必要なのか
生成AI(LLM)は非常に便利ですが、以下の弱点があります。
- 最新情報を知らない
- 事実確認ができない
- ハルシネーションを起こす
これらの弱点を補うために考え出されたのが RAG です。
RAGの基本的な考え方
RAGでは、生成AIにいきなり回答させません。
まず、
- 必要な情報を外部データから検索する
- その情報をAIに渡す
- AIが情報を元に文章を生成する
という流れを取ります。
これにより、 根拠のある回答 を生成しやすくなります。
RAGの処理フロー(概念)
RAGの流れを簡単に整理すると、以下のようになります。
- ユーザーが質問する
- 質問に関連する情報を検索する
- 検索結果をプロンプトに含める
- 生成AIが回答を作成する
このとき、AIは 検索された情報の範囲内で回答する ため、嘘をつきにくくなります。
RAGとハルシネーションの関係
前回の記事で解説した通り、 生成AIはハルシネーションを起こす可能性があります。
RAGは、
「AIの記憶」ではなく「実データ」を使わせる
ことで、 ハルシネーションを大幅に減らします。
ただし、 完全にゼロになるわけではない 点は重要です。
RAGで使われるデータの例
- 社内ドキュメント
- FAQ
- マニュアル
- PDF・Wordファイル
- Webページ
特に企業利用では、 社内情報を安全に活用できる 点が評価されています。
AzureでのRAGの考え方(AI-900視点)
AI-900では、 RAGの実装詳細までは求められません。
重要なのは、
- RAGは生成AIの弱点を補う仕組みである
- 検索+生成を組み合わせている
という概念理解です。
Azureでは、 Azure OpenAI と Azure AI Search を組み合わせることで RAGを実現できます。
RAGを使うと何ができるようになるのか
- 社内情報に基づいた回答
- 最新情報を反映した回答
- 根拠のある説明
そのため、
「業務で使える生成AI」 に一歩近づきます。
RAGが万能ではない理由
RAGにも限界はあります。
- 検索データが間違っていれば回答も間違う
- 検索精度が低いと効果が出ない
つまり、 データの品質が非常に重要 です。
AI-900試験での重要ポイント
- RAG=検索+生成の仕組み
- 生成AIの弱点(ハルシネーション)を補う
- 外部データを活用する考え方
「生成AIの精度向上策」として出題される可能性があります。
まとめ
- RAGは生成AIの弱点を補う仕組み
- 検索結果を使って回答を生成する
- AI-900では概念理解が重要
