Solutions · Open Source

Argus Catalog

データ・モデル・API・AIエージェントを単一のカタログでガバナンスする AI・Data・API 統合メタデータプラットフォームです。エアギャップ(閉域網)とオンプレミスを積極的にサポートし、データを外部に出すことなく全社的なデータ主権を確保します。

Apache License 2.0 · オープンソースGitHub リポジトリ

概念図

Argus Catalog Platform Architecture

特徴と強み

01

データ・モデル・API・AI を単一ガバナンス

データカタログ、MLモデルレジストリ、APIカタログ、AI Agent カタログを一つに統合し、全社的な信頼できる単一の情報源(SSOT)を実現します。

02

11種のデータソースを自動同期

Hive・Impala・Kudu・Trino・StarRocks・Greenplum・Iceberg REST・PostgreSQL・MySQL・Oracle・MSSQL のメタデータを自動収集し、スキーマ・統計・リネージを最新に保ちます。

03

カラムレベルのクロスプラットフォームリネージ

SQL パースに基づきデータセット・カラム単位のエンドツーエンドリネージを自動追跡し、DDL パースから ER 図を生成します。

04

エアギャップ・オンプレミス + ローカルLLM

OpenAI・Anthropic はもちろん Ollama などのローカル LLM とも連携し、データが外部に出ない閉域網でも完全な AI ガバナンスを実現します。

プラットフォームアーキテクチャ

Catalog UI・Server・Extensions・SDK が有機的に連携するエンドツーエンドのメタデータプラットフォームです。

Catalog UI
Next.js · React
データセット探索・管理
リネージ・ERD 可視化
モデルレジストリダッシュボード
品質ダッシュボード
API・AI Agent カタログ
セマンティック検索・AIアシスタント
Catalog Server
FastAPI · PostgreSQL
REST API (v1)
pgvector ハイブリッド検索
S3/MinIO モデルストア
MLflow・OCI 互換
データ品質エンジン
AIメタデータ生成
Extensions
Sync · Plugins · Analyzer
メタデータ同期(11種)
Impala Query Agent
Trino Query Listener
StarRocks Audit Plugin
ソースコード解析(Java/Python)
LDAP ユーザー同期
SDK & CLI
Python SDK
argus-model CLI
OCI ベースのモデル Push/Pull
HuggingFace インポート
エアギャップ転送ワークフロー
Presigned URL アップロード
Manifest 管理
対応データソース(11種)
HiveImpalaKuduTrinoStarRocksGreenplumIceberg RESTPostgreSQLMySQLOracleMSSQL

主要機能

データカタログから品質・ガバナンス、MLモデルレジストリ、AI まで — エンタープライズメタデータ管理の5本の柱を単一プラットフォームで提供します。

データカタログ

データセットを発見・信頼・ガバナンスするカタログの中核。

URN ベースのデータセット登録・検索・タグ・所有権
カラムレベルのリネージ & DDL ベースの ERD
データ標準辞書・用語集(形態素解析)
pgvector キーワード+セマンティックのハイブリッド検索

データ品質

ソースDBを直接プロファイリングし、ルールで検証。

プロファイリング(最頻値含む)・10種のルール検証
CUSTOM_SQL / CUSTOM_PYTHON ユーザー定義ルール
品質スコアの自動同期(GOOD/WARN/BAD)・推移
リネージ上流への品質伝播警告

メタデータガバナンス

データに留まらず API と AI エージェントもカタログ化。

API カタログ — OpenAPI スペック登録・バージョン diff・lint
AI Agent カタログ — ツール/MCP・評価・メータリング
URN ベースの統合メタデータ管理
スキーマ変更の影響分析・Webhook 通知

ML モデルレジストリ

MLflow・OCI 互換のモデルガバナンスとエアギャップ反入。

MLflow 連携・バージョン/Stage 管理(STAGING/PRODUCTION)
メトリクス比較・モデルカード
OCI モデルハブ(HuggingFace スタイルのブラウザ)
argus-model CLI・エアギャップインポート

AI

LLM でメタデータを自動生成し、カタログを問い合わせ。

AIメタデータ生成(説明・タグ・PII検出、承認型)
tool-use AIアシスタント(カタログ/スキーマ/品質/リネージ呼び出し)
実データに基づく応答
OpenAI・Anthropic・Ollama(ローカルLLM)連携
Apache License 2.0 · オープンソース

オープンソースとして公開されたメタデータプラットフォーム

Argus Catalog は Apache License 2.0 で GitHub に全面公開されています。メタデータ収集コネクタを除くバックエンド・フロントエンド・SDK・AIエージェント・品質バッチまで中核エンジン全体を公開しており、企業はコードを直接検証し、自社環境に合わせて拡張し、外部流出なく運用できます。

  • 商用利用に制約のない Apache 2.0
  • コードを自ら検証・拡張可能
  • エアギャップ・オンプレミスで自己運用