Argus RAG Studio
RAG(検索拡張生成)パイプラインの構築・運用・評価・サービングを一か所で行うオープンソースプラットフォームです。ドキュメントのインジェストからハイブリッド検索、引用付き回答生成、評価・運用・フィードバックまでRAGの全工程をカバーし、埋め込み・リランクをバックエンド内部でローカル実行できるため、エアギャップ(閉域網)・オンプレミスでも運用できます。
特徴と強み
インデックス・クエリ完結型RAGパイプライン
アップロード→解析→チャンク→埋め込み→インデックスのインジェストと、検索→リランク→生成のクエリを単一のバックエンドで処理します。コレクション(ナレッジベース)ごとに戦略を変えて構成できます。
ハイブリッド検索+引用付き回答
ベクトル(pgvector)とレキシカル(tsvector)検索をRRFで融合し、[n] グラウンディングで出典付きの回答を生成します。マルチターンチャットはSSEでストリーミングされます。
ローカル推論・エアギャップ運用
埋め込み・リランクを FastEmbed でバックエンド内にローカル実行できるため、外部推論サーバーは必須ではありません。生成LLMはOpenAI互換サーバーまたはClaudeに切り替わるBYO構成で、閉域網でも運用できます。
評価・運用・フィードバックの閉ループ
ゴールデンセットによる自動評価(Hit Rate・MRR・LLM-as-judge)、段階別レイテンシ・トークン追跡、回答の👍/👎フィードバックのゴールデンセット昇格まで、品質を測定し改善するループを備えます。
プラットフォームアーキテクチャ
フロントエンドダッシュボード・RAGバックエンド・推論・データストアが有機的に連携するエンドツーエンドのRAGプラットフォームです。
主要機能
インジェスト・解析・チャンクからハイブリッド検索・生成、評価・運用・フィードバックまで、RAGパイプラインの全工程を単一プラットフォームで提供します。
インジェスト
アップロードされたドキュメントを解析→チャンク→埋め込み→pgvector インデックスまで非同期で処理します。
解析戦略
インジェストの解析段階をコレクションごとに差し替えます(変更時は再インデックス)。
チャンク戦略
コレクションごとにチャンク方式と単位を差し替えます。
ハイブリッド検索&生成
キーワードと意味を組み合わせて検索し、引用付きの回答を生成します。
埋め込み&推論プロバイダ
埋め込み・リランク・生成LLMをローカルまたは独立サーバーに切り替えます。
評価
ゴールデンデータセットでRAGパイプラインの品質を自動測定します。
運用(Observability)
クエリの段階別レイテンシとトークン使用量を計測します。
パイプラインバージョン管理
検索・リランク・生成の設定をバージョン可能な第一級資産として管理します。
フィードバックループ
回答評価を集めてゴールデンセットに還元します。
オープンソースで公開されるRAGプラットフォーム
Argus RAG Studio は Apache License 2.0 で GitHub に公開されます。バックエンド(FastAPI)・フロントエンド(Next.js)・スタンドアロンの埋め込み/リランカーサーバーまでRAGエンジン全体を公開し、企業がコードを直接検証し、自社環境に合わせて拡張し、データを外部に出さずに運用できます。
- 商用利用の制約がない Apache 2.0
- コードを直接検証・拡張可能
- エアギャップ・オンプレミスで自社運用