Solutions · Open Source

Argus Catalog

데이터·모델·API·AI 에이전트를 하나의 카탈로그에서 거버넌스하는 AI·Data·API 통합 메타데이터 플랫폼입니다. 에어갭(폐쇄망)과 온프레미스를 적극 지원해, 데이터를 외부로 내보내지 않고도 전사 데이터 주권을 확보합니다.

Apache License 2.0 · 오픈소스GitHub 저장소

개념도

Argus Catalog Platform Architecture

특징 및 강점

01

데이터·모델·API·AI 단일 거버넌스

데이터 카탈로그, ML 모델 레지스트리, API 카탈로그, AI Agent 카탈로그를 하나로 통합해 전사 단일 진실의 원천(SSOT)을 구현합니다.

02

11종 데이터 소스 자동 동기화

Hive·Impala·Kudu·Trino·StarRocks·Greenplum·Iceberg REST·PostgreSQL·MySQL·Oracle·MSSQL의 메타데이터를 자동 수집해 스키마·통계·리니지를 최신 상태로 유지합니다.

03

컬럼 레벨 크로스 플랫폼 리니지

SQL 파싱 기반으로 데이터셋·컬럼 수준의 엔드투엔드 리니지를 자동 추적하고, DDL 파싱으로 ER 다이어그램을 생성합니다.

04

에어갭·온프레미스 + 로컬 LLM

OpenAI·Anthropic은 물론 Ollama 등 로컬 LLM과 연동되어, 데이터가 외부로 나가지 않는 폐쇄망에서도 완전한 AI 거버넌스를 구현합니다.

플랫폼 아키텍처

Catalog UI · Server · Extensions · SDK가 유기적으로 연동되는 엔드투엔드 메타데이터 플랫폼입니다.

Catalog UI
Next.js · React
데이터셋 탐색·관리
리니지·ERD 시각화
모델 레지스트리 대시보드
품질 대시보드
API·AI Agent 카탈로그
시맨틱 검색·AI 어시스턴트
Catalog Server
FastAPI · PostgreSQL
REST API (v1)
pgvector 하이브리드 검색
S3/MinIO 모델 저장소
MLflow·OCI 호환
데이터 품질 엔진
AI 메타데이터 생성
Extensions
Sync · Plugins · Analyzer
메타데이터 싱크 (11종)
Impala Query Agent
Trino Query Listener
StarRocks Audit Plugin
소스 코드 분석 (Java/Python)
LDAP 사용자 동기화
SDK & CLI
Python SDK
argus-model CLI
OCI 기반 모델 Push/Pull
HuggingFace Import
에어갭 전송 워크플로우
Presigned URL 업로드
Manifest 관리
지원 데이터 소스 (11종)
HiveImpalaKuduTrinoStarRocksGreenplumIceberg RESTPostgreSQLMySQLOracleMSSQL

핵심 기능

데이터 카탈로그부터 품질·거버넌스, ML 모델 레지스트리, AI까지 — 엔터프라이즈 메타데이터 관리의 5대 축을 단일 플랫폼에서 제공합니다.

데이터 카탈로그

데이터셋을 발견·신뢰·거버넌스하는 카탈로그의 핵심.

URN 기반 데이터셋 등록·검색·태그·소유권
컬럼 수준 리니지 & DDL 기반 ERD
데이터 표준 사전·용어집(형태소 분석)
pgvector 키워드+시맨틱 하이브리드 검색

데이터 품질

소스 DB를 직접 프로파일링하고 규칙으로 검증.

프로파일링(최빈값 포함)·10종 규칙 검증
CUSTOM_SQL/CUSTOM_PYTHON 사용자 규칙
품질 점수 자동 동기화(GOOD/WARN/BAD)·추세
리니지 업스트림 품질 전파 경고

메타데이터 거버넌스

데이터를 넘어 API와 AI 에이전트까지 카탈로그화.

API 카탈로그 — OpenAPI 스펙 등록·버전 diff·린트
AI Agent 카탈로그 — 도구/MCP·평가·미터링
URN 기반 통합 메타데이터 관리
스키마 변경 영향 분석·Webhook 알림

ML 모델 레지스트리

MLflow·OCI 호환 모델 거버넌스와 에어갭 반입.

MLflow 연동·버전/Stage 관리(STAGING/PRODUCTION)
메트릭 비교·모델 카드
OCI 모델 허브(HuggingFace 스타일 브라우저)
argus-model CLI·에어갭 임포트

AI

LLM으로 메타데이터를 자동 생성하고 카탈로그를 질의.

AI 메타데이터 생성(설명·태그·PII 감지, 승인형)
tool-use AI 어시스턴트(카탈로그/스키마/품질/리니지 호출)
실데이터 근거 응답
OpenAI·Anthropic·Ollama(로컬 LLM) 연동
Apache License 2.0 · 오픈소스

오픈소스로 공개된 메타데이터 플랫폼

Argus Catalog는 Apache License 2.0으로 GitHub에 전면 공개되어 있습니다. 메타데이터 수집 커넥터를 제외한 백엔드·프론트엔드·SDK·AI 에이전트·품질 배치까지 핵심 엔진 전체를 공개해, 기업이 코드를 직접 검증하고 자사 환경에 맞게 확장하며 외부 유출 없이 운영할 수 있습니다.

  • 상용 활용 제약 없는 Apache 2.0
  • 코드 직접 검증·확장 가능
  • 에어갭·온프레미스 자체 운영