Blog
aillmragfine-tuningglossary
AI 용어집 — LLM·RAG·파인튜닝·에이전트 최신 용어 총정리
LoRA·QLoRA·임베딩·청킹부터 RAG·추론 최적화·에이전트·멀티모달까지, AI 실무에 필요한 핵심 용어를 카테고리별로 한자리에 정리한 용어집.
Data Dynamics2026년 6월 24일35 min read
AI·LLM 분야는 용어가 빠르게 늘어나고, 같은 개념을 부르는 이름도 제각각입니다. 이 글은 실무에서 자주 마주치는 용어를 카테고리별 표로 정리한 레퍼런스입니다. 처음 보는 용어를 빠르게 찾아보거나, 팀의 공통 어휘를 맞추는 용도로 쓰세요. 각 항목은 "한 줄 정의"를 목표로 했고, 더 깊은 설명이 필요한 주제는 사내 다른 글로 이어집니다.
이 용어집은 살아있는 문서입니다. 분야가 바뀌면 계속 갱신합니다. 빠진 용어나 더 정확한 정의 제안은 언제든 환영합니다.
용어 지도
먼저 큰 그림입니다. 아래 분류를 따라 필요한 영역으로 바로 내려가세요.
Loading diagram…
1. 기초 개념
| 용어 | 영문 / 약어 | 한 줄 설명 |
|---|---|---|
| 인공지능 | AI (Artificial Intelligence) | 인간의 인지 작업을 기계가 수행하도록 하는 기술의 총칭 |
| 머신러닝 | ML (Machine Learning) | 데이터로부터 규칙을 학습하는 AI의 한 갈래 |
| 딥러닝 | DL (Deep Learning) | 다층 신경망 기반 머신러닝 |
| 신경망 | Neural Network | 가중치로 연결된 뉴런 층으로 입력을 출력에 매핑하는 모델 |
| 파라미터 | Parameter / Weight | 학습으로 조정되는 모델 내부의 수치(가중치·편향) |
| 하이퍼파라미터 | Hyperparameter | 학습률·배치 크기처럼 학습 전에 사람이 정하는 설정값 |
| 학습 / 추론 | Training / Inference | 파라미터를 조정하는 과정 / 학습된 모델로 결과를 내는 과정 |
| 지도/비지도/강화학습 | Supervised / Unsupervised / RL | 정답 라벨 사용 / 라벨 없음 / 보상으로 학습하는 패러다임 |
| 과적합 / 일반화 | Overfitting / Generalization | 학습 데이터에만 맞음 / 처음 보는 데이터에도 잘 동작함 |
| 손실 함수 | Loss Function | 예측과 정답의 차이를 수치화한 학습 목표 |
| 경사하강법 | Gradient Descent | 손실을 줄이는 방향으로 파라미터를 갱신하는 최적화 기법 |
| 역전파 | Backpropagation | 손실의 기울기를 거꾸로 전파해 가중치를 갱신하는 알고리즘 |
| 에폭 / 배치 | Epoch / Batch | 전체 데이터 1회 학습 / 한 번에 처리하는 표본 묶음 |
2. LLM·Transformer 구조
| 용어 | 영문 / 약어 | 한 줄 설명 |
|---|---|---|
| 거대 언어 모델 | LLM (Large Language Model) | 방대한 텍스트로 학습해 언어를 이해·생성하는 대규모 모델 |
| 트랜스포머 | Transformer | 어텐션 기반의 현대 LLM 기본 아키텍처 |
| 어텐션 | Attention | 입력 토큰들의 상호 중요도를 가중치로 계산하는 메커니즘 |
| 셀프 어텐션 | Self-Attention | 한 시퀀스 내부 토큰들끼리 관계를 계산하는 어텐션 |
| 멀티헤드 어텐션 | Multi-Head Attention | 여러 어텐션을 병렬로 두어 다양한 관계를 포착 |
| 인코더 / 디코더 | Encoder / Decoder | 입력 이해부 / 출력 생성부. GPT 계열은 디코더-온리 |
| 사전학습 가중치 | Foundation Model | 범용으로 사전학습되어 여러 작업의 토대가 되는 모델 |
| 컨텍스트 윈도 | Context Window | 모델이 한 번에 다룰 수 있는 토큰의 최대 길이 |
| 위치 인코딩 | Positional Encoding | 토큰의 순서 정보를 벡터에 주입하는 방식 |
| 파라미터 수 | Model Size (e.g. 7B, 70B) | 모델 규모 지표. B는 10억 개 파라미터 |
| 정렬된 모델 | Instruct / Chat Model | 지시 수행·대화에 맞게 후처리(정렬)된 모델 변형 |
3. 토큰·임베딩·표현
| 용어 | 영문 / 약어 | 한 줄 설명 |
|---|---|---|
| 토큰 | Token | 모델이 처리하는 텍스트의 최소 단위(단어·부분단어·문자) |
| 토크나이저 | Tokenizer | 텍스트를 토큰으로 쪼개고 ID로 변환하는 모듈 |
| 토큰화 | Tokenization | 텍스트를 토큰 시퀀스로 변환하는 과정 (예: BPE, SentencePiece) |
| 어휘 사전 | Vocabulary | 토크나이저가 아는 토큰의 전체 집합 |
| 임베딩 | Embedding | 토큰·문장·문서를 의미가 담긴 고차원 실수 벡터로 변환한 표현 |
| 임베딩 모델 | Embedding Model | 텍스트를 벡터로 바꾸는 전용 모델 (검색·RAG의 핵심) |
| 차원 | Dimension | 임베딩 벡터의 길이(예: 768, 1536, 3072 차원) |
| 벡터 정규화 | Normalization | 벡터 크기를 1로 맞춰 코사인 유사도 계산을 안정화 |
| 잠재 공간 | Latent / Vector Space | 의미가 가까운 항목이 가까이 위치하는 표현 공간 |
| 로짓 | Logits | 소프트맥스 직전, 각 토큰의 미정규화 점수 |
| 확률분포 | Probability Distribution | 로짓을 정규화해 얻는 다음 토큰 확률 |
4. 학습 단계
| 용어 | 영문 / 약어 | 한 줄 설명 |
|---|---|---|
| 사전학습 | Pretraining | 대규모 코퍼스로 다음 토큰 예측을 학습하는 1차 학습 |
| 파인튜닝 | Fine-tuning | 사전학습 모델을 특정 작업·도메인 데이터로 추가 학습 |
| 지도 미세조정 | SFT (Supervised Fine-Tuning) | 입력-정답 쌍으로 지시 수행 능력을 학습 |
| 인스트럭션 튜닝 | Instruction Tuning | 다양한 지시문-응답으로 "지시를 따르도록" 학습 |
| 인간 피드백 강화학습 | RLHF | 인간 선호를 보상모델로 만들어 강화학습으로 정렬 |
| 직접 선호 최적화 | DPO (Direct Preference Optimization) | 보상모델 없이 선호 쌍으로 직접 정렬하는 경량 기법 |
| AI 피드백 강화학습 | RLAIF | 사람 대신 AI가 선호 라벨을 생성해 정렬 |
| 정렬 | Alignment | 모델 출력을 인간 의도·가치에 맞추는 과정 |
| 보상 모델 | Reward Model | 응답의 품질·선호를 점수화하도록 학습한 모델 |
| 지속 학습 | Continual / Continued Pretraining | 새 도메인 데이터로 사전학습을 이어가는 것 |
| 파국적 망각 | Catastrophic Forgetting | 새 학습으로 이전에 알던 것을 잃는 현상 |
| 합성 데이터 | Synthetic Data | 모델·규칙으로 생성한 학습용 데이터 |
5. 효율적 파인튜닝 (PEFT)
| 용어 | 영문 / 약어 | 한 줄 설명 |
|---|---|---|
| 효율적 파인튜닝 | PEFT (Parameter-Efficient Fine-Tuning) | 전체가 아닌 소수 파라미터만 학습해 비용을 줄이는 기법군 |
| LoRA | Low-Rank Adaptation | 가중치 변화를 저랭크 행렬 두 개로 근사해 소수만 학습 |
| QLoRA | Quantized LoRA | 베이스 모델을 4비트로 양자화한 상태에서 LoRA를 학습 |
| DoRA | Weight-Decomposed LoRA | 가중치를 크기·방향으로 분해해 LoRA 성능을 끌어올린 변형 |
| 어댑터 | Adapter | 층 사이에 작은 학습 모듈을 끼워 넣는 PEFT 방식 |
| 프롬프트 튜닝 | Prompt Tuning | 입력 앞에 학습 가능한 "소프트 프롬프트" 벡터를 붙임 |
| 프리픽스 튜닝 | Prefix Tuning | 각 층의 키/값 앞에 학습 가능한 프리픽스를 추가 |
| 랭크 | Rank (r) | LoRA 저랭크 행렬의 크기. 표현력과 비용의 트레이드오프 |
| 어댑터 병합 | Merge | 학습한 LoRA 가중치를 베이스에 합쳐 단일 모델로 만듦 |
| 풀 파인튜닝 | Full Fine-Tuning | 모든 파라미터를 갱신하는 전통적 방식(고비용) |
6. 양자화·경량화·서빙 최적화
| 용어 | 영문 / 약어 | 한 줄 설명 |
|---|---|---|
| 양자화 | Quantization | 가중치·활성값을 낮은 비트(예: INT4/INT8/FP8)로 표현해 경량화 |
| 사후 양자화 | PTQ (Post-Training Quantization) | 학습 후 추가 학습 없이 양자화 |
| 양자화 인지 학습 | QAT (Quantization-Aware Training) | 양자화를 고려해 학습해 정확도 손실을 줄임 |
| GPTQ / AWQ | GPTQ / AWQ | 대표적인 사후 양자화 알고리즘(정확도 보존형) |
| GGUF | GGUF | llama.cpp 계열에서 쓰는 양자화 모델 파일 포맷 |
| 지식 증류 | Knowledge Distillation | 큰 교사 모델의 지식을 작은 학생 모델로 옮김 |
| 가지치기 | Pruning | 덜 중요한 가중치·연결을 제거해 경량화 |
| KV 캐시 | KV Cache | 이미 계산한 키/값을 저장해 토큰 생성 속도를 높임 |
| 페이지드 어텐션 | PagedAttention | KV 캐시를 페이지 단위로 관리하는 메모리 기법(vLLM) |
| 연속 배칭 | Continuous Batching | 요청을 동적으로 묶어 GPU 활용도를 높이는 서빙 기법 |
| 추측 디코딩 | Speculative Decoding | 작은 모델이 미리 토큰을 제안해 생성을 가속 |
| 처리량 / 지연 | Throughput / Latency | 초당 처리량 / 응답까지 걸리는 시간 |
| 첫 토큰 지연 | TTFT (Time To First Token) | 요청 후 첫 토큰이 나오기까지의 시간 |
7. 추론·디코딩 파라미터
| 용어 | 영문 / 약어 | 한 줄 설명 |
|---|---|---|
| 온도 | Temperature | 출력 무작위성 조절. 낮으면 보수적, 높으면 다양 |
| Top-k | Top-k Sampling | 확률 상위 k개 토큰 중에서만 샘플링 |
| Top-p | Nucleus Sampling | 누적확률 p가 될 때까지의 토큰 집합에서 샘플링 |
| 그리디 디코딩 | Greedy Decoding | 매 단계 가장 확률 높은 토큰만 선택 |
| 빔 서치 | Beam Search | 여러 후보 경로를 동시에 추적해 더 나은 시퀀스 탐색 |
| 반복 페널티 | Repetition / Frequency Penalty | 같은 토큰 반복을 억제하는 보정 |
| 최대 토큰 | Max Tokens | 생성할 최대 토큰 수 제한 |
| 정지 시퀀스 | Stop Sequence | 특정 문자열이 나오면 생성을 멈추는 조건 |
| 펄플렉서티 | Perplexity | 모델이 텍스트를 얼마나 잘 예측하는지의 지표(낮을수록 좋음) |
| 구조화 출력 | Structured Output / JSON Mode | 스키마(JSON 등)에 맞춰 출력하도록 강제 |
8. RAG·검색·벡터
| 용어 | 영문 / 약어 | 한 줄 설명 |
|---|---|---|
| 검색 증강 생성 | RAG (Retrieval-Augmented Generation) | 외부 문서를 검색해 근거로 삼아 답을 생성하는 구조 |
| 청킹 | Chunking | 긴 문서를 검색·임베딩 단위로 잘게 나누는 전처리 |
| 청크 오버랩 | Chunk Overlap | 청크 경계에서 문맥 손실을 줄이려 일부를 겹치게 자름 |
| 벡터 데이터베이스 | Vector DB | 임베딩 벡터를 저장·검색하는 DB (예: pgvector, Milvus) |
| 유사도 검색 | Similarity Search | 질의 벡터와 가까운 벡터를 찾는 검색 |
| 코사인 유사도 | Cosine Similarity | 두 벡터의 방향 유사도를 재는 대표 척도 |
| 근사 최근접 이웃 | ANN (Approximate Nearest Neighbor) | 정확도를 조금 양보해 빠르게 가까운 벡터를 찾는 검색 |
| HNSW | HNSW | 그래프 기반의 대표적 ANN 인덱스 |
| 밀집 / 희소 검색 | Dense / Sparse Retrieval | 임베딩 기반 / 키워드(BM25) 기반 검색 |
| 하이브리드 검색 | Hybrid Search | 밀집+희소를 결합해 정확도를 높이는 검색 |
| 리랭킹 | Reranking | 1차 검색 결과를 더 정밀한 모델로 재정렬 |
| 재현율 / 정밀도 | Recall / Precision | 관련 문서를 얼마나 빠짐없이 / 정확히 가져왔는가 |
| GraphRAG | GraphRAG | 지식 그래프를 결합해 관계·요약을 강화한 RAG |
| 컨텍스트 주입 | Context Injection / Grounding | 검색한 근거를 프롬프트에 넣어 답을 사실에 묶음 |
9. 프롬프트 엔지니어링
| 용어 | 영문 / 약어 | 한 줄 설명 |
|---|---|---|
| 프롬프트 | Prompt | 모델에 주는 입력 지시문 |
| 시스템 프롬프트 | System Prompt | 모델의 역할·규칙을 정하는 상위 지시 |
| 제로샷 / 퓨샷 | Zero-shot / Few-shot | 예시 없이 / 몇 개 예시를 주고 수행시키기 |
| 인컨텍스트 러닝 | In-Context Learning | 학습 없이 프롬프트의 예시만으로 작업을 학습하는 능력 |
| 생각의 사슬 | CoT (Chain-of-Thought) | 중간 추론 단계를 적게 해 정확도를 높이는 기법 |
| ReAct | Reasoning + Acting | 추론과 도구 사용(행동)을 번갈아 수행하는 패턴 |
| 프롬프트 템플릿 | Prompt Template | 변수를 끼워 재사용하는 프롬프트 양식 |
| 프롬프트 캐싱 | Prompt Caching | 반복되는 프롬프트 앞부분을 캐시해 비용·지연 절감 |
| 컨텍스트 엔지니어링 | Context Engineering | 모델에 넣을 정보(검색·기억·도구)를 설계·관리하는 작업 |
| 탈옥 | Jailbreak | 안전장치를 우회하도록 유도하는 프롬프트 공격 |
| 프롬프트 인젝션 | Prompt Injection | 외부 입력으로 지시를 덮어써 모델을 오작동시키는 공격 |
10. 에이전트·툴·프로토콜
| 용어 | 영문 / 약어 | 한 줄 설명 |
|---|---|---|
| AI 에이전트 | Agent | 목표를 위해 스스로 계획·도구 사용·반복을 수행하는 시스템 |
| 툴 사용 | Tool Use / Function Calling | 모델이 외부 함수·API를 호출해 능력을 확장 |
| 멀티 에이전트 | Multi-Agent | 여러 에이전트가 역할을 나눠 협업하는 구조 |
| 오케스트레이션 | Orchestration | 여러 단계·에이전트·도구의 실행 흐름을 조율 |
| 메모리 | Memory | 대화·작업 맥락을 저장·회상하는 기능(단기/장기) |
| MCP | Model Context Protocol | 모델과 외부 도구·데이터를 연결하는 표준 프로토콜 |
| A2A | Agent-to-Agent | 에이전트 간 상호 통신·협업을 위한 프로토콜 |
| 가드레일 | Guardrails | 입출력을 검증·필터링해 안전·정책을 강제하는 장치 |
| 휴먼 인 더 루프 | HITL (Human-in-the-Loop) | 중요한 판단에 사람의 승인·개입을 끼워 넣는 설계 |
| 자율성 수준 | Autonomy Level | 에이전트가 사람 개입 없이 행동하는 정도 |
| 에이전틱 워크플로 | Agentic Workflow | 계획→실행→검증을 반복하는 에이전트 기반 작업 흐름 |
| 계획 수립 | Planning | 목표를 하위 단계로 나누고 실행 순서를 세우는 에이전트 능력 |
| 작업 분해 | Task Decomposition | 큰 작업을 다룰 수 있는 하위 작업으로 쪼개기 |
| 반성 | Reflection / Self-Critique | 자기 출력을 스스로 점검·수정해 품질을 높이는 루프 |
| 서브 에이전트 | Subagent | 상위 에이전트가 특정 하위 작업을 위임하는 하위 에이전트 |
| 핸드오프 | Handoff | 한 에이전트가 다른 에이전트에게 작업·맥락을 넘기는 것 |
| 라우터 | Router | 요청을 적절한 도구·에이전트·모델로 분기 |
| 궤적 | Trajectory | 에이전트의 관찰-행동 단계들의 전체 실행 기록 |
| 도구 스키마 | Tool Schema | 도구의 이름·인자·타입을 정의한 명세(JSON Schema) |
| 병렬 툴 호출 | Parallel Tool Calls | 여러 도구를 동시에 호출해 지연을 줄임 |
| 컴퓨터 사용 | Computer Use | 화면·마우스·키보드를 제어해 GUI를 직접 조작하는 능력 |
| 코드 인터프리터 | Code Interpreter | 샌드박스에서 코드를 실행해 계산·분석을 수행하는 도구 |
| MCP 서버 | MCP Server | 도구·리소스·프롬프트를 MCP로 노출하는 외부 프로세스 |
| MCP 클라이언트 | MCP Client | MCP 서버에 연결해 도구·데이터를 사용하는 모델/호스트 측 |
| MCP 호스트 | MCP Host | MCP 클라이언트를 품고 모델과 연결하는 애플리케이션(예: IDE, 챗 앱) |
| MCP 전송 | MCP Transport (stdio/HTTP) | MCP 통신 채널. 로컬 stdio 또는 원격 HTTP/SSE |
| MCP 리소스/툴/프롬프트 | MCP Resource / Tool / Prompt | MCP 서버가 노출하는 3대 요소(읽을 데이터 / 실행 함수 / 프롬프트 템플릿) |
| A2A 에이전트 카드 | A2A Agent Card | 에이전트의 능력·엔드포인트를 기술해 발견을 돕는 메타데이터 |
| A2A 태스크 | A2A Task | A2A에서 에이전트 간 주고받는 작업 단위 |
| 능력 발견 | Capability Discovery | 다른 에이전트·도구의 기능을 동적으로 찾아내는 것 |
| 상호운용성 | Interoperability | 서로 다른 벤더의 에이전트·도구가 표준으로 협업하는 성질 |
11. 멀티모달·생성
| 용어 | 영문 / 약어 | 한 줄 설명 |
|---|---|---|
| 멀티모달 | Multimodal | 텍스트·이미지·음성 등 여러 양식을 함께 다루는 모델 |
| 비전-언어 모델 | VLM (Vision-Language Model) | 이미지와 텍스트를 함께 이해하는 모델 |
| 디퓨전 모델 | Diffusion Model | 노이즈를 점진적으로 제거해 이미지를 생성하는 방식 |
| 텍스트-이미지 | Text-to-Image | 텍스트 설명으로 이미지를 생성 (예: 이미지 생성 모델) |
| CLIP | CLIP | 이미지와 텍스트를 같은 공간에 임베딩해 연결하는 모델 |
| 음성 인식 | ASR (Speech-to-Text) | 음성을 텍스트로 변환 |
| 음성 합성 | TTS (Text-to-Speech) | 텍스트를 음성으로 변환 |
| OCR | OCR | 이미지 속 문자를 텍스트로 인식 |
| 생성형 AI | Generative AI | 새로운 텍스트·이미지·음성·코드를 생성하는 AI |
| 잠재 확산 | Latent Diffusion | 압축된 잠재공간에서 확산을 수행해 효율을 높인 생성 |
12. 평가·안전·운영
| 용어 | 영문 / 약어 | 한 줄 설명 |
|---|---|---|
| 환각 | Hallucination | 사실이 아닌 내용을 그럴듯하게 생성하는 현상 |
| 그라운딩 | Grounding | 출력을 검증 가능한 근거(문서·데이터)에 묶는 것 |
| 벤치마크 | Benchmark | 표준 데이터셋으로 모델 성능을 비교하는 평가 |
| 평가 | Eval | 모델·시스템의 품질을 정량·정성으로 측정하는 작업 |
| LLM 심판 | LLM-as-a-Judge | 다른 LLM으로 출력 품질을 채점하는 평가 방식 |
| 레드티밍 | Red Teaming | 의도적 공격으로 취약점·위험을 찾는 안전 점검 |
| 안전성 / 정렬세 | Safety / Alignment Tax | 유해 출력 억제 / 안전을 위해 감수하는 성능 손실 |
| 편향 | Bias | 데이터·모델에 내재한 불공정한 경향 |
| 옵저버빌리티 | Observability | 토큰·지연·비용·품질을 추적·모니터링 |
| LLMOps | LLMOps | LLM 앱의 배포·평가·모니터링·운영 전반 |
| 토큰 비용 | Token Cost | 입력·출력 토큰 수에 비례하는 API 사용 비용 |
| 가드레일 평가 | Guardrail / Policy Eval | 안전·정책 준수를 점검하는 평가 |
13. 최신·심화 토픽
| 용어 | 영문 / 약어 | 한 줄 설명 |
|---|---|---|
| 전문가 혼합 | MoE (Mixture of Experts) | 입력마다 일부 전문가 네트워크만 활성화해 효율적으로 확장 |
| 그룹 쿼리 어텐션 | GQA (Grouped-Query Attention) | 키/값 헤드를 묶어 KV 캐시·메모리를 줄이는 어텐션 |
| 회전 위치 임베딩 | RoPE (Rotary Position Embedding) | 회전 변환으로 위치를 인코딩, 긴 문맥에 유리 |
| 플래시 어텐션 | FlashAttention | 메모리 접근을 최적화해 어텐션을 빠르게 계산 |
| 상태공간 모델 | SSM / Mamba | 어텐션 대신 상태공간으로 긴 시퀀스를 효율 처리하는 계열 |
| 롱 컨텍스트 | Long Context | 수십만~수백만 토큰을 다루는 긴 문맥 능력 |
| 추론 모델 | Reasoning Model | 답하기 전 더 오래 "생각"하도록 학습한 모델 계열 |
| 테스트타임 컴퓨트 | Test-Time Compute | 추론 시 연산을 더 써서 정확도를 높이는 전략 |
| 사고 토큰 | Thinking / Reasoning Tokens | 최종 답 이전에 생성하는 내부 추론용 토큰 |
| 컨텍스트 캐싱 | Context Caching | 긴 공통 컨텍스트를 캐시해 반복 요청 비용을 절감 |
| 스케일링 법칙 | Scaling Laws | 모델·데이터·연산 규모와 성능의 관계를 설명하는 경험칙 |
| 창발 능력 | Emergent Ability | 규모가 커질 때 갑자기 나타나는 능력 |
| 모델 병합 | Model Merging | 여러 모델 가중치를 합쳐 새 모델을 만드는 기법 |
| 에이전트 메모리 | Agentic / Long-term Memory | 에이전트가 세션을 넘어 정보를 저장·활용하는 메모리 |
14. MLOps·LLMOps
| 용어 | 영문 / 약어 | 한 줄 설명 |
|---|---|---|
| MLOps | MLOps | ML 모델의 학습·배포·모니터링·운영을 자동화·표준화하는 실천 |
| LLMOps | LLMOps | LLM 앱에 특화된 운영(프롬프트·평가·비용·안전·서빙) |
| 모델 레지스트리 | Model Registry | 모델 버전·메타데이터·스테이지를 관리하는 저장소 |
| 피처 스토어 | Feature Store | 학습·서빙에 공통으로 쓰는 피처를 저장·제공하는 시스템 |
| 실험 추적 | Experiment Tracking | 하이퍼파라미터·지표·아티팩트를 기록·비교(예: MLflow) |
| 모델 서빙 | Model Serving | 학습된 모델을 API·엔드포인트로 제공 |
| 데이터/모델 버저닝 | Data / Model Versioning | 데이터셋·모델을 버전으로 관리해 재현성 확보 |
| 재현성 | Reproducibility | 같은 입력·코드로 같은 결과를 다시 얻을 수 있는 성질 |
| 드리프트 | Drift (Data / Concept) | 데이터 분포나 정답 관계가 시간이 지나며 변하는 현상 |
| 모델 모니터링 | Model Monitoring | 운영 중 정확도·드리프트·이상을 추적 |
| 카나리 / 섀도 배포 | Canary / Shadow Deployment | 일부 트래픽에만 / 실서비스 영향 없이 새 모델을 검증 |
| 챔피언-챌린저 | Champion-Challenger | 운영 모델과 후보 모델을 나란히 비교 운영 |
| A/B 테스트 | A/B Test | 두 버전을 트래픽 분할로 비교 평가 |
| ML 파이프라인 | ML Pipeline | 데이터→학습→평가→배포를 자동화한 워크플로 |
| 모델 카드 | Model Card | 모델의 용도·한계·평가를 문서화한 명세 |
| 프롬프트 버저닝 | Prompt Versioning | 프롬프트를 버전 관리하고 회귀 평가 |
| 골든 데이터셋 | Golden Dataset | 회귀 평가의 기준이 되는 검증된 정답 데이터 |
| 트레이싱 | Tracing (OpenTelemetry) | 요청이 거치는 단계(span)를 추적해 디버깅·분석 |
| LLM 게이트웨이 | LLM Gateway | 여러 모델 호출을 중앙에서 라우팅·키관리·로깅·제한 |
| 시맨틱 캐시 | Semantic Cache | 의미가 비슷한 요청의 결과를 캐시해 비용·지연 절감 |
| 폴백 / 라우팅 | Fallback / Routing | 실패·과부하 시 다른 모델로 우회하거나 분기 |
| 토큰 예산 | Token Budgeting | 요청·세션의 토큰 사용 상한을 관리 |
15. AI 보안
| 용어 | 영문 / 약어 | 한 줄 설명 |
|---|---|---|
| OWASP LLM Top 10 | OWASP LLM Top 10 | LLM 앱의 대표 보안 위협 10가지를 정리한 표준 목록 |
| 프롬프트 인젝션 | Prompt Injection | 외부 입력으로 지시를 덮어써 모델을 오작동시키는 공격 |
| 간접 프롬프트 인젝션 | Indirect Prompt Injection | 문서·웹 등 외부 데이터에 악성 지시를 숨겨 주입 |
| 탈옥 | Jailbreak | 안전장치를 우회하도록 유도하는 공격 |
| 안전하지 않은 출력 처리 | Insecure Output Handling | 모델 출력을 검증 없이 실행·렌더해 생기는 취약점(XSS·코드 실행 등) |
| 과도한 권한 | Excessive Agency | 에이전트에 과한 도구·권한을 줘 피해가 커지는 위험 |
| 데이터 유출 | Data Exfiltration / Leakage | 민감정보가 출력·외부 호출을 통해 새어 나가는 것 |
| PII 노출 | PII Exposure | 개인식별정보가 학습·출력에 노출되는 위험 |
| 데이터 중독 | Data Poisoning | 학습 데이터에 악성 샘플을 섞어 모델을 오염시키는 공격 |
| 모델 추출 | Model Extraction / Stealing | 질의를 반복해 모델을 복제·탈취하는 공격 |
| 멤버십 추론 | Membership Inference | 특정 데이터가 학습에 쓰였는지 알아내는 공격 |
| 모델 역전 | Model Inversion | 출력으로부터 학습 데이터를 복원하려는 공격 |
| 적대적 예제 | Adversarial Example | 미세한 변형으로 모델을 속이는 입력 |
| 백도어 / 트로이 | Backdoor / Trojan | 특정 트리거에만 악의적으로 동작하도록 심은 함정 |
| 공급망 보안 | Supply Chain Security | 모델·데이터·의존성의 출처·무결성을 검증 |
| 모델 출처 | Model Provenance | 모델이 어디서 어떻게 만들어졌는지에 대한 추적 정보 |
| 샌드박싱 | Sandboxing | 도구·코드 실행을 격리해 피해 범위를 제한 |
| 최소 권한 | Least Privilege | 도구·에이전트에 꼭 필요한 권한만 부여 |
| 도구 허용/차단목록 | Tool Allowlist / Denylist | 호출 가능한 도구를 명시적으로 제한 |
| 콘텐츠 모더레이션 | Content Moderation | 유해·정책 위반 입출력을 탐지·차단 |
| DLP | Data Loss Prevention | 민감정보 유출을 탐지·차단하는 통제 |
| 프롬프트 방화벽 | Prompt Firewall / Guardrails | 입출력을 검사해 공격·위반을 막는 보안 계층 |
| 감사 로그 | Audit Log | 누가 무엇을 했는지 기록해 추적·사후분석 |
| 워터마킹 | Watermarking | 생성물에 식별 신호를 심어 출처를 표시 |
| 휴먼 승인 | Human Approval (HITL) | 위험한 행동 전에 사람의 승인을 요구하는 통제 |
마무리
여기까지가 현재 실무에서 가장 자주 쓰이는 AI·LLM 용어들입니다. 용어는 계속 늘어나므로 이 글도 주기적으로 업데이트할 예정입니다. 더 깊이 들어가고 싶다면, RAG·임베딩·파인튜닝·에이전트 각 주제를 다룬 사내 블로그 글들을 함께 보시길 권합니다.
용어를 외우는 것보다 중요한 건 개념 간의 관계를 잡는 것입니다. 위 "용어 지도"를 출발점으로, 한 카테고리씩 손에 익혀 가세요.