데이터다이나믹스, AI·Data·API 통합 카탈로그 'Argus Catalog' 오픈소스로 공개
데이터다이나믹스가 통합 메타데이터 관리 솔루션 'Argus Catalog'를 Apache License 2.0으로 GitHub에 전면 공개했다. '데이터 주권은 기업 스스로 확보해야 한다'며 커뮤니티 기반의 지속 개선도 선언했다.
"데이터 주권은 특정 벤더가 아니라 기업 스스로 확보해야" … GitHub 통해 전면 공개, 커뮤니티 기반 지속 개선 선언
AI 및 데이터 플랫폼 전문기업 주식회사 데이터다이나믹스(Data Dynamics) 가 자사의 통합 메타데이터 관리 솔루션 'Argus Catalog' 를 오픈소스로 공개한다고 11일 밝혔다. 소스코드는 GitHub 공개 저장소(DataDynamics-OSS/argus-catalog)를 통해 배포되며, 라이선스는 상용 활용에 제약이 없는 Apache License 2.0 을 채택했다.
Argus Catalog는 흩어져 있는 기업의 데이터·AI 자산을 한곳에서 발견하고, 신뢰하고, 거버넌스할 수 있도록 설계된 AI·Data·API 통합 카탈로그다. 데이터다이나믹스는 메타데이터 수집 커넥터 모듈을 제외한 백엔드, 프론트엔드, SDK, AI 에이전트, 품질 배치, 사용자 매뉴얼 전 영역을 GitHub에 전면 공개한다.
주요 구성
- 데이터 카탈로그 — DataHub 스타일의 데이터셋 등록·검색·태깅·용어집과 함께, 이기종 시스템 간 흐름을 추적하는 컬럼 수준 리니지, ER 다이어그램, 데이터 품질 프로파일링·규칙 검증·품질 점수 자동 동기화, 형태소 분석 기반 데이터 표준 준수율 측정을 제공한다.
- ML 모델 레지스트리 — Unity Catalog OSS 호환 API와 MLflow 연동, OCI 매니페스트 기반 모델 허브(HuggingFace 스타일 브라우저·Airgap 임포트)를 통해 모델의 버전·스테이지·메트릭을 거버넌스한다.
- AI 거버넌스 — LLM 기반 AI 메타데이터 자동 생성(설명·요약·컬럼 설명·태그 추천·PII 감지), 카탈로그 실데이터를 도구로 호출해 답하는 tool-use AI 어시스턴트, 그리고 에이전트의 도구·MCP·평가·미터링을 관리하는 AI Agent 카탈로그까지 포함한다.
- API 카탈로그 & 시맨틱 검색 — 외부 시스템을 위한 캐시된 메타데이터·Avro 스키마 API와 pgvector 기반 하이브리드(키워드+시맨틱) 검색을 기본 탑재했다.
특히 AI 메타데이터 생성과 어시스턴트는 OpenAI·Anthropic는 물론 Ollama 등 로컬 LLM과도 연동돼, 데이터가 외부로 나가지 않는 온프레미스·에어갭 환경에서도 완전한 AI 거버넌스를 구현할 수 있도록 했다.
"데이터 주권을 기업 스스로"
데이터다이나믹스는 이번 공개의 배경으로 '데이터 주권' 을 강조했다.
"메타데이터와 거버넌스는 기업 데이터 전략의 심장부인데, 정작 이 영역이 특정 벤더에 종속되면 기업은 자기 데이터의 흐름조차 자유롭게 들여다볼 수 없게 된다. Argus Catalog를 Apache 2.0으로 GitHub에 공개하는 것은, 어떤 기업이든 자사 인프라 위에서 자기 데이터와 AI 자산을 스스로 통제할 수 있어야 한다는 믿음의 실천이다."
— 김병곤 대표
이어 김 대표는 "수집 커넥터는 추후 공개를 순차적으로 할 예정이며, 이를 제외한 핵심 엔진 전체를 공개한 만큼, 기업들은 코드를 직접 검증하고, 자사 환경에 맞게 확장하며, 외부로의 데이터 유출 없이 운영할 수 있다"고 덧붙였다.
커뮤니티 기반 지속 개선 로드맵
데이터다이나믹스는 일회성 공개에 그치지 않고, GitHub 저장소를 거점으로 오픈소스 커뮤니티와 함께 기능을 지속적으로 발전시켜 나가겠다는 로드맵도 제시했다. 김병곤 대표는 커뮤니티와 함께 추진할 핵심 과제로 다음을 꼽았다.
- 다양한 데이터 소스·쿼리 엔진으로의 커넥터 생태계 확대
- AI 에이전트 거버넌스·평가 체계 고도화
- 리니지·품질·표준의 자동화 수준 강화
사용자 매뉴얼(Antora 기반)과 데모 시드 데이터, 로컬 개발 인프라 구성까지 함께 공개해 기여 진입 장벽을 낮춘 것도 같은 맥락이다. 누구나 GitHub 저장소에서 이슈·풀리퀘스트를 통해 개선에 참여할 수 있다.
"더 많은 기업과 개발자가 참여할수록 카탈로그는 더 정교해지고, 그 혜택은 다시 모든 사용자에게 돌아간다. Argus Catalog가 특정 기업의 제품을 넘어, 많은 기업이 데이터 주권을 확보하는 공통의 토대가 되도록 커뮤니티와 함께 키워가겠다."
— 김병곤 대표