データダイナミクス、AI・Data・API統合カタログ「Argus Catalog」をオープンソースで公開
データダイナミクスが統合メタデータ管理ソリューション「Argus Catalog」を Apache License 2.0 で GitHub に全面公開した。「データ主権は企業自らが確保すべき」とし、コミュニティ基盤の継続的な改善も宣言した。
「データ主権は特定ベンダーではなく、企業自らが確保すべき」… GitHub を通じて全面公開、コミュニティ基盤の継続的改善を宣言
AIおよびデータプラットフォーム専門企業の**株式会社データダイナミクス(Data Dynamics)は、自社の統合メタデータ管理ソリューション「Argus Catalog」**をオープンソースで公開すると11日、明らかにした。ソースコードは GitHub の公開リポジトリ(DataDynamics-OSS/argus-catalog)を通じて配布され、ライセンスは商用利用に制約のない Apache License 2.0 を採用した。
Argus Catalog は、散在する企業のデータ・AI資産を一箇所で発見し、信頼し、ガバナンスできるよう設計された AI・Data・API 統合カタログである。データダイナミクスは、メタデータ収集コネクタモジュールを除くバックエンド、フロントエンド、SDK、AIエージェント、品質バッチ、ユーザーマニュアルの全領域を GitHub に全面公開する。
主な構成
- データカタログ — DataHub スタイルのデータセット登録・検索・タグ付け・用語集に加え、異種システム間のフローを追跡するカラムレベルのリネージ、ER図、データ品質プロファイリング・ルール検証・品質スコアの自動同期、形態素解析に基づくデータ標準準拠率の測定を提供する。
- MLモデルレジストリ — Unity Catalog OSS 互換 API と MLflow 連携、OCI マニフェストベースのモデルハブ(HuggingFace スタイルのブラウザ・エアギャップインポート)を通じて、モデルのバージョン・ステージ・メトリクスをガバナンスする。
- AIガバナンス — LLM によるAIメタデータの自動生成(説明・要約・カラム説明・タグ推薦・PII検出)、カタログの実データをツールとして呼び出して回答する tool-use AIアシスタント、さらにエージェントのツール・MCP・評価・メータリングを管理する AI Agent カタログまで含む。
- APIカタログ&セマンティック検索 — 外部システム向けのキャッシュ済みメタデータ・Avroスキーマ API と、pgvector ベースのハイブリッド(キーワード+セマンティック)検索を標準搭載した。
特にAIメタデータ生成とアシスタントは、OpenAI・Anthropic はもちろん Ollama などのローカル LLM とも連携し、データが外部に出ないオンプレミス・エアギャップ環境でも完全なAIガバナンスを実現できるようにした。
「データ主権を企業自らの手に」
データダイナミクスは今回の公開の背景として**「データ主権」**を強調した。
「メタデータとガバナンスは企業データ戦略の心臓部であるが、まさにこの領域が特定ベンダーに依存すると、企業は自社データの流れすら自由に把握できなくなる。Argus Catalog を Apache 2.0 で GitHub に公開するのは、どの企業であっても自社インフラ上で自社のデータとAI資産を自ら統制できるべきだという信念の実践だ」
— キム・ビョンゴン代表
続けて同代表は「収集コネクタは今後、順次公開する予定であり、これを除く中核エンジン全体を公開した以上、企業はコードを直接検証し、自社環境に合わせて拡張し、外部へのデータ流出なく運用できる」と述べた。
コミュニティ基盤の継続的改善ロードマップ
データダイナミクスは一度きりの公開にとどまらず、GitHub リポジトリを拠点にオープンソースコミュニティとともに機能を継続的に発展させていくというロードマップも提示した。キム・ビョンゴン代表は、コミュニティとともに推進する重点課題として次を挙げた。
- 多様なデータソース・クエリエンジンへのコネクタエコシステムの拡大
- AIエージェントのガバナンス・評価体系の高度化
- リネージ・品質・標準の自動化レベルの強化
ユーザーマニュアル(Antora ベース)とデモ用シードデータ、ローカル開発インフラ構成まで併せて公開し、貢献への参入障壁を下げたのも同じ文脈だ。誰でも GitHub リポジトリのイシュー・プルリクエストを通じて改善に参加できる。
「より多くの企業と開発者が参加するほどカタログはより精緻になり、その恩恵は再びすべてのユーザーに還元される。Argus Catalog が特定企業の製品を超え、多くの企業がデータ主権を確保する共通の土台となるよう、コミュニティとともに育てていく」
— キム・ビョンゴン代表