Solutions · Open Source

Argus Catalog

在单一目录中对数据、模型、API 与 AI 智能体进行治理的 AI·Data·API 一体化元数据平台。积极支持气隙(隔离网络)与本地部署,让企业无需将数据外发即可掌握全公司的数据主权。

Apache License 2.0 · 开源GitHub 仓库

概念图

Argus Catalog Platform Architecture

特点与优势

01

数据·模型·API·AI 统一治理

将数据目录、ML 模型注册表、API 目录与 AI Agent 目录融为一体,实现全公司的单一可信数据源(SSOT)。

02

11 种数据源自动同步

自动采集 Hive、Impala、Kudu、Trino、StarRocks、Greenplum、Iceberg REST、PostgreSQL、MySQL、Oracle、MSSQL 的元数据,使模式、统计与血缘保持最新。

03

列级跨平台血缘

基于 SQL 解析自动追踪数据集与列级的端到端血缘,并通过 DDL 解析生成 ER 图。

04

气隙·本地部署 + 本地 LLM

不仅支持 OpenAI、Anthropic,也可与 Ollama 等本地 LLM 集成,在数据不外流的隔离网络中也能实现完整的 AI 治理。

平台架构

Catalog UI、Server、Extensions、SDK 有机协同的端到端元数据平台。

Catalog UI
Next.js · React
数据集浏览与管理
血缘与 ERD 可视化
模型注册表仪表盘
质量仪表盘
API 与 AI Agent 目录
语义搜索与 AI 助手
Catalog Server
FastAPI · PostgreSQL
REST API (v1)
pgvector 混合搜索
S3/MinIO 模型库
兼容 MLflow 与 OCI
数据质量引擎
AI 元数据生成
Extensions
Sync · Plugins · Analyzer
元数据同步(11 种)
Impala Query Agent
Trino Query Listener
StarRocks Audit Plugin
源代码分析(Java/Python)
LDAP 用户同步
SDK & CLI
Python SDK
argus-model CLI
基于 OCI 的模型 Push/Pull
HuggingFace 导入
气隙传输工作流
Presigned URL 上传
Manifest 管理
支持的数据源(11 种)
HiveImpalaKuduTrinoStarRocksGreenplumIceberg RESTPostgreSQLMySQLOracleMSSQL

核心功能

从数据目录到质量与治理、ML 模型注册表,再到 AI——在单一平台提供企业元数据管理的五大支柱。

数据目录

发现、信任并治理数据集的目录核心。

基于 URN 的数据集注册、搜索、标签与归属
列级血缘与基于 DDL 的 ERD
数据标准词典与术语表(形态素分析)
pgvector 关键词+语义混合搜索

数据质量

直接剖析源数据库并以规则校验。

剖析(含众数)与 10 类校验规则
CUSTOM_SQL / CUSTOM_PYTHON 自定义规则
质量分数自动同步(GOOD/WARN/BAD)与趋势
沿血缘向上游传播的质量告警

元数据治理

不止于数据,连 API 与 AI 智能体一并编目。

API 目录——OpenAPI 规范注册、版本 diff 与 lint
AI Agent 目录——工具/MCP、评估与计量
基于 URN 的统一元数据管理
模式变更影响分析与 Webhook 通知

ML 模型注册表

兼容 MLflow/OCI 的模型治理与气隙导入。

MLflow 集成与版本/阶段管理(STAGING/PRODUCTION)
指标对比与模型卡
OCI 模型中心(HuggingFace 风格浏览器)
argus-model CLI 与气隙导入

AI

用 LLM 自动生成元数据并查询目录。

AI 元数据生成(描述、标签、PII 检测,审批式)
tool-use AI 助手(调用目录/模式/质量/血缘工具)
基于真实数据的回答
集成 OpenAI、Anthropic 与 Ollama(本地 LLM)
Apache License 2.0 · 开源

已开源的元数据平台

Argus Catalog 已在 GitHub 上以 Apache License 2.0 全面开源。除元数据采集连接器外,后端、前端、SDK、AI 智能体、质量批处理等整个核心引擎均已公开,企业可直接验证代码、按自身环境扩展,并在不外泄数据的情况下运行。

  • 对商业使用无限制的 Apache 2.0
  • 可自行验证与扩展代码
  • 气隙·本地部署自主运行