検索拡張生成(Retrieval Augmented Generation)のためのフレームワークとツール。
検索拡張生成(RAG)は、大規模言語モデル(LLM)の能力を外部データソースからの情報で拡張する技術です。 これにより、LLMは自身の訓練データに含まれていない、または最新の情報を利用して回答を生成できるようになります。
様々なソース(ドキュメント、ウェブサイト、データベースなど)からデータを収集し、 チャンク分割、クリーニング、フィルタリングなどの前処理を行います。
テキストチャンクを埋め込みモデル(Embedding Model)を使用してベクトル表現に変換し、 ベクトルデータベースに保存します。
ユーザークエリを埋め込みに変換し、ベクトルデータベースから類似度の高いチャンクを検索します。 セマンティック検索、キーワード検索、ハイブリッド検索などの手法が使われます。
取得した関連情報をLLMのプロンプトに組み込み、より正確で情報に基づいた回答を生成します。 プロンプトエンジニアリングや引用の追加などの技術が使われます。