Solutions · Open Source

Argus RAG Studio

RAGパイプラインの構築（Build）・検索/生成（Retrieve & Generate）・評価（Evaluate）・運用/デプロイ（Operate & Deploy）を一か所で扱うオープンソースのセルフホスト型RAGプラットフォームです。「一度動くRAGデモ」ではなく、品質を数値で測る評価ハーネス、最適設定を自動探索するスイープ、フィードバック還流、エージェントベースの遠隔デプロイまで備え、オンプレミス・エアギャップ（閉域網）で運用できます。

Apache License 2.0 · オープンソースGitHub リポジトリ製品紹介資料

特徴と強み

測定 → 最適化 → 改善ループ

ゴールデンセット・Hit Rate/MRR・LLM-as-Judge 3軸で品質を数値化し、設定スイープがチャンク・検索モード・リランカーの最適な組み合わせを自動探索、ユーザーフィードバック👍/👎はゴールデンセットへ還流します — 自前構築RAGの多くが欠くループが標準機能です。

ハイブリッド検索＋引用付き回答

ベクトル（pgvector）とレキシカル（tsvector）をRRFで融合し、リランキング（LLM・cross-encoder）で並べ替え、[n] 引用付きの回答をSSEでストリーミングします。異種埋め込みのナレッジベースもフェデレーションクエリで一括検索できます。

韓国語・韓国文書に特化

HWP/HWPX専用Rustパーサー（rhwp）、kssによる韓国語文分割、VLM・OCR（PaddleOCR）によるスキャン文書パイプライン、AI-Hub互換アノテーションまで — 一般的なオープンソースRAGフレームワークにはない軸です。

エアギャップ・エージェント遠隔デプロイ

モデルをパック（pack）として搬入しデプロイ時に自動インストール。各ホストのエージェントがワーカー・埋め込み・リランカー・VLMサーバーを遠隔デプロイします。zotレジストリでコンテナまで完全オフライン — 金融・公共・防衛の網分離要件に対応します。

プラットフォームアーキテクチャ

フロントエンドダッシュボード・RAGバックエンド・推論サーバー・データストア/レジストリが有機的に連携し、推論・ワーカーはエージェントで分離デプロイして規模に応じて段階的に拡張します。

Frontend Dashboard

Next.js 16 · React 19

ナレッジベース・Playground・チャット

パイプライン・評価・可観測性

フィードバック・文書ルーティング・ファインチューニング

アノテーション・画像エクスプローラー

モデル管理・サーバー管理・ソースウォッチ

ジョブ（Jobs）・ユーザー/権限・APIキー・PIIルール

RAG Backend

FastAPI :4700

インジェスト — 解析・チャンク・埋め込み・索引（非同期ワーカー）

クエリ — ハイブリッド検索・リランク・生成

評価・トレース・フィードバック・パイプラインバージョン

RAG文書ルーティング・ソースウォッチ

servermgr — エージェントデプロイ・プロキシ・ハートビート

REST・SSEストリーミング・ローカルJWT/Keycloak

Inference

ローカルまたは分離デプロイ

埋め込み :8080 — FastEmbedローカル・OpenAI互換

リランカー :8081 — cross-encoder

検出（OCR）:8082 — PaddleOCR・EasyOCR

生成LLM — Claude・OpenAI互換・Ollama・vLLM

VLM（vLLM）— スキャン文書・画像解析

GPUバリアント — cpu・gpu(onnx)・gpu-torch

Data Stores

PostgreSQL · MinIO · zot

PostgreSQL + pgvector — チャンク・ベクトル・tsvector

トレース・評価・フィードバックを同一データプレーンに

MinIO / S3 — 原本文書・画像・モデルパック

Model Repository（argus-models）

zot OCIレジストリ — 閉域網イメージ

buildx bake — amd64+arm64 マルチアーキ

技術スタック

Python 3.11+FastAPI (async)SQLAlchemy 2.0Pydantic v2PostgreSQL + pgvectorMinIO / S3Next.js 16React 19TypeScriptTailwind 4 · shadcn/uiFastEmbed(ONNX) · torch(cu128)Docker/Podman · zot · buildxJWT · Keycloak OIDC · APIキー

主要機能

インジェスト・解析・チャンクからハイブリッド検索・生成、評価・設定スイープ・検索ファインチューニング、バージョン・可観測性、エージェントデプロイ・エアギャップ、アノテーション・画像まで — RAG全周期の12本の柱を単一プラットフォームで提供します。

インジェストパイプライン

マルチフォーマット文書をアップロード→解析→チャンク→埋め込み→索引まで非同期ワーカーで処理します。

txt/pdf/docx/xlsx/pptx/hwp/hwpx などマルチフォーマットローダー

ソースウォッチ — ドロップゾーン定期スキャン・無人取り込み

content_hash 冪等性・再処理（reindex）

ジョブ進捗の追跡・ワーカーの分離デプロイ

解析戦略5種

文書特性に合わせて解析戦略をコレクション単位で選択します（未導入時は自動フォールバック）。

text · layout（pdfplumber）· docai（docling）

vlm — ビジョンLLM（スキャン・複雑レイアウト）

rhwp — HWP/HWPX専用Rustパーサー（結合表を保持）

可用性イントロスペクション・実モデル検証

チャンク戦略8種

検索品質を左右するチャンクを、表の保持・意味境界まで緻密に実装しました。

recursive · fixed · sentence（韓国語kss）· paragraph · section

markdown（表・コードブロック保持・見出しbreadcrumb）· semantic · auto

char / token（tiktoken）単位・スマートオーバーラップ

小チャンク結合・チャンク予算キャップなどの品質ガード

ナレッジベース設計 — fail-closed分離

コレクションをテーマの束ではなく、セキュリティ分離境界として設計しました。

全クエリを collection_id で物理フィルタリング（fail-closed）

埋め込みモデル・次元・距離メトリックを不変に固定 — ベクトル空間の整合性

決定的文書ルーティング — 優先順位・first-match-wins

セキュリティ等級が不確実なら最高等級に割り当てる特則

ハイブリッド検索＆生成

意味とキーワードを並列検索して融合し、引用付きの回答を生成します。

ベクトル（pgvector）＋レキシカル（tsvector）＋RRF融合

リランキング none / llm / cross_encoder

[n] グラウンディング引用回答・マルチターンチャット（SSE）

フェデレーションクエリ — 異種埋め込みコレクションのRRF統合

モデルの柔軟性

埋め込み・リランカー・生成LLM・VLM・OCRをワークロードに合わせて入れ替えます。

埋め込み — local（FastEmbed）· OpenAI互換（TEI/vLLM/Ollama）· 既定 bge-m3

生成LLM — Claude・OpenAI互換・Ollama・vLLM

VLM（vLLM）・OCR検出（PaddleOCR/EasyOCR）

コレクション別モデル・次元・距離の指定・次元自動検知

評価ハーネス

ゴールデンデータセットとLLMジャッジで品質を数値で測定します。

ゴールデンセット（質問・正解文書）管理・フィードバック昇格

検索指標 — Hit Rate・MRR

生成指標 — LLM-as-Judge 3軸（Faithfulness・Relevance・Correctness）

holdout・過学習フラグ・ジャッジゲーティング

設定スイープ＆改善ループ

チャンク・検索モード・top-k・リランカーの組み合わせを自動探索し、リーダーボードで比較します。

クエリ軸＋インデックス軸（一時コレクション）のスイープ

リーダーボード — Hit Rate・MRR・ジャッジスコアで整列

優勝設定をパイプライン新バージョンへ反映・ロールバック

トレース → フィードバック👍/👎 → ゴールデンセット昇格の還流

検索ファインチューニング

ドメイン用語・略語に合わせて埋め込み・リランカーをチューニングします。

用語辞書 → 合成クエリ生成・ラベリングUIレビュー

（クエリ・正例・負例）トリプレット学習データセット構成

JSONLエクスポート・外部トレーナー（M2Mコールバック）

モデルレジストリ登録 → 埋め込みサーバー入れ替えデプロイ

パイプラインバージョン＆可観測性

検索・リランク・生成設定をバージョン可能な資産として扱い、すべてのクエリを計測します。

append-onlyバージョン・ステージ・ロールバック・フィールド別diff

バージョンごとの評価連動 — リグレッションを事前遮断

Query Trace — 段階別レイテンシ・トークンキャプチャ

統計 — 成功率・p50/p95・人気クエリ・APIキー（M2M）

エージェント遠隔デプロイ＆エアギャップ

各ホストのArgus Agentがワーカー・推論サーバーをデプロイし、閉域網へはモデルパックで搬入します。

servermgr — エージェント登録・遠隔デプロイ・プロキシ・ハートビート

GPUバリアント自動選択 — amd64 gpu(onnx)・arm64 gpu-torch

モデルパック搬入・Model Repository自動インストール・オフラインサービング

zot OCIレジストリ・buildxマルチアーキイメージ

アノテーション＆画像パイプライン

文書内の画像・スキャンをOCR・VLMで知識化します。

画像OCRラベリング — AI-Hub JSON互換

検出サーバーによる下書きラベル提案（PaddleOCR/EasyOCR）

画像エクスプローラー・VLM内容分析の索引化

HWPプレビュー — Chromiumレンダリング（@rhwp/core）

Apache License 2.0 · オープンソース

オープンソースで公開されるRAGプラットフォーム

Argus RAG Studio は Apache License 2.0 で GitHub に公開されます。バックエンド（FastAPI）・フロントエンド（Next.js）・スタンドアロンの埋め込み/リランカーサーバーまでRAGエンジン全体を公開し、企業がコードを直接検証し、自社環境に合わせて拡張し、データを外部に出さずに運用できます。

商用利用の制約がない Apache 2.0
コードを直接検証・拡張可能
エアギャップ・オンプレミスで自社運用

GitHub リポジトリお問い合わせ

お問い合わせ