Argus RAG Studio
RAG(검색 증강 생성) 파이프라인의 구축·운영·평가·서빙을 한곳에서 수행하는 오픈소스 플랫폼입니다. 문서 인제스천부터 하이브리드 검색, 인용 기반 답변 생성, 평가·운영·피드백까지 RAG의 전 과정을 다루며, 임베딩·리랭킹을 백엔드 내부에서 로컬로 실행할 수 있어 에어갭(폐쇄망)·온프레미스에서도 운영할 수 있습니다.
특징 및 강점
색인·질의 완결형 RAG 파이프라인
업로드→파싱→청킹→임베딩→색인의 인제스천과, 검색→리랭크→생성의 질의를 하나의 백엔드에서 처리합니다. 컬렉션(지식베이스)마다 전략을 다르게 구성할 수 있습니다.
하이브리드 검색 + 인용 답변
벡터(pgvector)와 렉시컬(tsvector) 검색을 RRF로 융합하고, [n] 그라운딩으로 출처가 달린 답변을 생성합니다. 멀티턴 챗은 SSE로 스트리밍됩니다.
로컬 추론 · 에어갭 운영
임베딩·리랭킹을 FastEmbed로 백엔드 안에서 로컬 실행할 수 있어 외부 추론 서버가 필수가 아닙니다. 생성 LLM은 OpenAI 호환 서버나 Claude로 전환되는 BYO 구조라 폐쇄망에서도 운영됩니다.
평가·운영·피드백 폐루프
골든셋 기반 자동 평가(Hit Rate·MRR·LLM-as-judge), 단계별 지연·토큰 추적, 답변 👍/👎 피드백의 골든셋 승격까지 — 품질을 측정하고 개선하는 루프를 갖춥니다.
플랫폼 아키텍처
프런트엔드 대시보드 · RAG 백엔드 · 추론 · 데이터 스토어가 유기적으로 연동되는 엔드투엔드 RAG 플랫폼입니다.
핵심 기능
인제스천·파싱·청킹부터 하이브리드 검색·생성, 평가·운영·피드백까지 — RAG 파이프라인의 전 과정을 단일 플랫폼에서 제공합니다.
인제스천
문서를 업로드하면 파싱→청킹→임베딩→pgvector 색인까지 비동기로 처리합니다.
파싱 전략
인제스천의 파싱 단계를 컬렉션별로 교체합니다(변경 시 재인덱싱).
청킹 전략
컬렉션별로 청킹 방식과 단위를 교체합니다.
하이브리드 검색 & 생성
키워드와 의미를 결합해 검색하고 인용이 달린 답변을 생성합니다.
임베딩 & 추론 프로바이더
임베딩·리랭킹·생성 LLM을 로컬 또는 독립 서버로 전환합니다.
평가
골든 데이터셋으로 RAG 파이프라인 품질을 자동 측정합니다.
운영 (Observability)
질의의 단계별 지연과 토큰 사용량을 계측합니다.
파이프라인 버전 관리
검색·리랭크·생성 설정을 버전 가능한 1급 자산으로 관리합니다.
피드백 루프
답변 평가를 모아 골든셋으로 되먹입니다.
오픈소스로 공개되는 RAG 플랫폼
Argus RAG Studio는 Apache License 2.0으로 GitHub에 공개됩니다. 백엔드(FastAPI)·프론트엔드(Next.js)·독립 임베딩/리랭커 서버까지 RAG 엔진 전체를 공개해, 기업이 코드를 직접 검증하고 자사 환경에 맞게 확장하며 데이터를 외부로 내보내지 않고 운영할 수 있습니다.
- 상용 활용 제약 없는 Apache 2.0
- 코드 직접 검증·확장 가능
- 에어갭·온프레미스 자체 운영