検索拡張生成(RAG:Retrieval-Augmented Generation)とは、大規模言語モデル(LLM)が回答を生成する前に、外部データソースから関連情報を検索し、その内容を入力として与える手法である。LLM の事前学習では扱えない最新の情報や組織固有の文書を参照できる点が特徴で、回答の根拠となる情報を明示しやすい。検索対象には、文書、データベース、ナレッジベースなどが利用される。
RAG を用いても生成内容が常に正確になるわけではないが、適切な検索結果がモデルに提示される場合には、回答の妥当性が向上しやすい。一方で、検索段階で誤った文書が取得されたり、検索結果をモデルが正しく解釈できない場合には、誤答や想像的な生成が起きる可能性があるため、ハルシネーションの完全な排除は保証されない。
ファインチューニングと異なり、RAG では外部データを参照する仕組みを通じて柔軟に更新へ対応できる。ただし、外部データを入れ替えるだけでは不十分であり、埋め込みベクトルの再計算やインデックス再構築が必要となる。ファインチューニングは検索を伴わず高速な推論が可能だが、データ更新のたびに再学習が必要となるなど運用面の負荷が大きい。RAG は、情報更新の頻度や運用要件に応じては選択され得る手法である。
ParsleyLab:Excel形式で柔軟に記録しつつ、組織内で簡単かつ自由にデータを蓄積・活用できるソリューション