Solutions · Open Source

Argus RAG Studio

RAG(検索拡張生成)パイプラインの構築・運用・評価・サービングを一か所で行うオープンソースプラットフォームです。ドキュメントのインジェストからハイブリッド検索、引用付き回答生成、評価・運用・フィードバックまでRAGの全工程をカバーし、埋め込み・リランクをバックエンド内部でローカル実行できるため、エアギャップ(閉域網)・オンプレミスでも運用できます。

Apache License 2.0 · オープンソースGitHub リポジトリ

特徴と強み

01

インデックス・クエリ完結型RAGパイプライン

アップロード→解析→チャンク→埋め込み→インデックスのインジェストと、検索→リランク→生成のクエリを単一のバックエンドで処理します。コレクション(ナレッジベース)ごとに戦略を変えて構成できます。

02

ハイブリッド検索+引用付き回答

ベクトル(pgvector)とレキシカル(tsvector)検索をRRFで融合し、[n] グラウンディングで出典付きの回答を生成します。マルチターンチャットはSSEでストリーミングされます。

03

ローカル推論・エアギャップ運用

埋め込み・リランクを FastEmbed でバックエンド内にローカル実行できるため、外部推論サーバーは必須ではありません。生成LLMはOpenAI互換サーバーまたはClaudeに切り替わるBYO構成で、閉域網でも運用できます。

04

評価・運用・フィードバックの閉ループ

ゴールデンセットによる自動評価(Hit Rate・MRR・LLM-as-judge)、段階別レイテンシ・トークン追跡、回答の👍/👎フィードバックのゴールデンセット昇格まで、品質を測定し改善するループを備えます。

プラットフォームアーキテクチャ

フロントエンドダッシュボード・RAGバックエンド・推論・データストアが有機的に連携するエンドツーエンドのRAGプラットフォームです。

Frontend Dashboard
Next.js 16 · React 19
ナレッジベース・ドキュメント管理
Playground · Chat
パイプライン編集・バージョン
評価データセット・Run
運用(トレース)・統計
フィードバック・ユーザー/権限
RAG Backend
FastAPI :4700
インジェスト(解析・チャンク・埋め込み・インデックス)
クエリ(検索・リランク・生成)
評価・運用・フィードバック
パイプラインバージョン管理
ローカル/Keycloak 認証
REST · SSE ストリーミング
Inference
ローカルまたは独立サーバー
埋め込み — FastEmbed ローカル · サーバー :8080
リランカー — FastEmbed ローカル · サーバー :8081
生成LLM — OpenAI互換 · Claude
ビジョンLLM(BYO)— vlm 解析用
Data Stores
PostgreSQL · MinIO
PostgreSQL + pgvector
チャンク・ベクトル・tsvector・メタ
クエリトレース・評価・フィードバック
MinIO / S3 原本ドキュメント
技術スタック
Python 3.11FastAPISQLAlchemy 2.0PostgreSQL + pgvectorPydantic v2Next.js 16React 19TypeScriptTailwind 4 · shadcn/uiJWT · Keycloak OIDCFastEmbed (ONNX)Anthropic SDK

主要機能

インジェスト・解析・チャンクからハイブリッド検索・生成、評価・運用・フィードバックまで、RAGパイプラインの全工程を単一プラットフォームで提供します。

インジェスト

アップロードされたドキュメントを解析→チャンク→埋め込み→pgvector インデックスまで非同期で処理します。

txt/md/csv/json/html/xml/pdf/docx/xlsx/pptx/hwp/hwpx ローダー
HWP・HWPX・PDF・DOCX・XLSX のメタデータ抽出
content_hash 冪等性・再処理(reindex)
非同期ワーカー・ジョブ進捗追跡

解析戦略

インジェストの解析段階をコレクションごとに差し替えます(変更時は再インデックス)。

text · layout(表→Markdown)· docai(docling)
vlm — 外部ビジョンLLM(BYO)
rhwp — HWP/HWPX の結合表を保持
可用性 introspection · 実モデル検証

チャンク戦略

コレクションごとにチャンク方式と単位を差し替えます。

recursive · sentence(韓国語 kss)· fixed
markdown(表・見出し)· semantic(意味境界)
char / token(tiktoken)単位 · size · overlap
オーバーラップのスマート切断・品質ガード

ハイブリッド検索&生成

キーワードと意味を組み合わせて検索し、引用付きの回答を生成します。

ベクトル(pgvector)+レキシカル(tsvector)+RRF 融合
[n] グラウンディング引用回答生成
マルチターンチャット — SSE トークン・出典ストリーミング
リランク none/llm/cross_encoder

埋め込み&推論プロバイダ

埋め込み・リランク・生成LLMをローカルまたは独立サーバーに切り替えます。

埋め込み — OpenAI互換 · ローカル(FastEmbed)· hash
コレクション別モデル・次元・サーバーURL・キャッシュ再利用
独立した埋め込み(:8080)・リランカー(:8081)サーバー
生成LLM — OpenAI互換 · Claude(anthropic SDK)

評価

ゴールデンデータセットでRAGパイプラインの品質を自動測定します。

ゴールデンセット(質問・期待回答・期待出典)CRUD
検索指標 — Hit Rate · MRR(LLM不要)
生成指標 — LLM-as-judge(faithfulness 等)
評価 Run 非同期ワーカー・指標テーブル

運用(Observability)

クエリの段階別レイテンシとトークン使用量を計測します。

Query Trace — retrieval/rerank/generation レイテンシ
トークン使用量キャプチャ(OpenAI互換 · Claude)
統計 — 成功率 · レイテンシ p50/p95 · 人気クエリ
best-effort 計測(リクエストを妨げない)

パイプラインバージョン管理

検索・リランク・生成の設定をバージョン可能な第一級資産として管理します。

append-only バージョン · ロールバック · フィールド単位 diff
2バージョンを同一クエリで比較(実験)
距離メトリック override
search/query/chat に pipeline_id を適用

フィードバックループ

回答評価を集めてゴールデンセットに還元します。

Playground・Chat 回答の👍/👎ウィジェット
trace_id で特定の回答に帰属
フィードバック → ゴールデンセット項目へ昇格(promote)
評価/状態フィルタ · 統計 · 管理画面
Apache License 2.0 · オープンソース

オープンソースで公開されるRAGプラットフォーム

Argus RAG Studio は Apache License 2.0 で GitHub に公開されます。バックエンド(FastAPI)・フロントエンド(Next.js)・スタンドアロンの埋め込み/リランカーサーバーまでRAGエンジン全体を公開し、企業がコードを直接検証し、自社環境に合わせて拡張し、データを外部に出さずに運用できます。

  • 商用利用の制約がない Apache 2.0
  • コードを直接検証・拡張可能
  • エアギャップ・オンプレミスで自社運用