aillmragfine-tuningglossary

AI 용어집 — LLM·RAG·파인튜닝·에이전트 최신 용어 총정리

LoRA·QLoRA·임베딩·청킹부터 RAG·추론 최적화·에이전트·멀티모달까지, AI 실무에 필요한 핵심 용어를 카테고리별로 한자리에 정리한 용어집.

Data Dynamics2026년 6월 24일35 min read

AI·LLM 분야는 용어가 빠르게 늘어나고, 같은 개념을 부르는 이름도 제각각입니다. 이 글은 실무에서 자주 마주치는 용어를 카테고리별 표로 정리한 레퍼런스입니다. 처음 보는 용어를 빠르게 찾아보거나, 팀의 공통 어휘를 맞추는 용도로 쓰세요. 각 항목은 "한 줄 정의"를 목표로 했고, 더 깊은 설명이 필요한 주제는 사내 다른 글로 이어집니다.

이 용어집은 살아있는 문서입니다. 분야가 바뀌면 계속 갱신합니다. 빠진 용어나 더 정확한 정의 제안은 언제든 환영합니다.

용어 지도

먼저 큰 그림입니다. 아래 분류를 따라 필요한 영역으로 바로 내려가세요.

Loading diagram…

1. 기초 개념

용어	영문 / 약어	한 줄 설명
인공지능	AI (Artificial Intelligence)	인간의 인지 작업을 기계가 수행하도록 하는 기술의 총칭
머신러닝	ML (Machine Learning)	데이터로부터 규칙을 학습하는 AI의 한 갈래
딥러닝	DL (Deep Learning)	다층 신경망 기반 머신러닝
신경망	Neural Network	가중치로 연결된 뉴런 층으로 입력을 출력에 매핑하는 모델
파라미터	Parameter / Weight	학습으로 조정되는 모델 내부의 수치(가중치·편향)
하이퍼파라미터	Hyperparameter	학습률·배치 크기처럼 학습 전에 사람이 정하는 설정값
학습 / 추론	Training / Inference	파라미터를 조정하는 과정 / 학습된 모델로 결과를 내는 과정
지도/비지도/강화학습	Supervised / Unsupervised / RL	정답 라벨 사용 / 라벨 없음 / 보상으로 학습하는 패러다임
과적합 / 일반화	Overfitting / Generalization	학습 데이터에만 맞음 / 처음 보는 데이터에도 잘 동작함
손실 함수	Loss Function	예측과 정답의 차이를 수치화한 학습 목표
경사하강법	Gradient Descent	손실을 줄이는 방향으로 파라미터를 갱신하는 최적화 기법
역전파	Backpropagation	손실의 기울기를 거꾸로 전파해 가중치를 갱신하는 알고리즘
에폭 / 배치	Epoch / Batch	전체 데이터 1회 학습 / 한 번에 처리하는 표본 묶음

2. LLM·Transformer 구조

용어	영문 / 약어	한 줄 설명
거대 언어 모델	LLM (Large Language Model)	방대한 텍스트로 학습해 언어를 이해·생성하는 대규모 모델
트랜스포머	Transformer	어텐션 기반의 현대 LLM 기본 아키텍처
어텐션	Attention	입력 토큰들의 상호 중요도를 가중치로 계산하는 메커니즘
셀프 어텐션	Self-Attention	한 시퀀스 내부 토큰들끼리 관계를 계산하는 어텐션
멀티헤드 어텐션	Multi-Head Attention	여러 어텐션을 병렬로 두어 다양한 관계를 포착
인코더 / 디코더	Encoder / Decoder	입력 이해부 / 출력 생성부. GPT 계열은 디코더-온리
사전학습 가중치	Foundation Model	범용으로 사전학습되어 여러 작업의 토대가 되는 모델
컨텍스트 윈도	Context Window	모델이 한 번에 다룰 수 있는 토큰의 최대 길이
위치 인코딩	Positional Encoding	토큰의 순서 정보를 벡터에 주입하는 방식
파라미터 수	Model Size (e.g. 7B, 70B)	모델 규모 지표. B는 10억 개 파라미터
정렬된 모델	Instruct / Chat Model	지시 수행·대화에 맞게 후처리(정렬)된 모델 변형

3. 토큰·임베딩·표현

용어	영문 / 약어	한 줄 설명
토큰	Token	모델이 처리하는 텍스트의 최소 단위(단어·부분단어·문자)
토크나이저	Tokenizer	텍스트를 토큰으로 쪼개고 ID로 변환하는 모듈
토큰화	Tokenization	텍스트를 토큰 시퀀스로 변환하는 과정 (예: BPE, SentencePiece)
어휘 사전	Vocabulary	토크나이저가 아는 토큰의 전체 집합
임베딩	Embedding	토큰·문장·문서를 의미가 담긴 고차원 실수 벡터로 변환한 표현
임베딩 모델	Embedding Model	텍스트를 벡터로 바꾸는 전용 모델 (검색·RAG의 핵심)
차원	Dimension	임베딩 벡터의 길이(예: 768, 1536, 3072 차원)
벡터 정규화	Normalization	벡터 크기를 1로 맞춰 코사인 유사도 계산을 안정화
잠재 공간	Latent / Vector Space	의미가 가까운 항목이 가까이 위치하는 표현 공간
로짓	Logits	소프트맥스 직전, 각 토큰의 미정규화 점수
확률분포	Probability Distribution	로짓을 정규화해 얻는 다음 토큰 확률

4. 학습 단계

용어	영문 / 약어	한 줄 설명
사전학습	Pretraining	대규모 코퍼스로 다음 토큰 예측을 학습하는 1차 학습
파인튜닝	Fine-tuning	사전학습 모델을 특정 작업·도메인 데이터로 추가 학습
지도 미세조정	SFT (Supervised Fine-Tuning)	입력-정답 쌍으로 지시 수행 능력을 학습
인스트럭션 튜닝	Instruction Tuning	다양한 지시문-응답으로 "지시를 따르도록" 학습
인간 피드백 강화학습	RLHF	인간 선호를 보상모델로 만들어 강화학습으로 정렬
직접 선호 최적화	DPO (Direct Preference Optimization)	보상모델 없이 선호 쌍으로 직접 정렬하는 경량 기법
AI 피드백 강화학습	RLAIF	사람 대신 AI가 선호 라벨을 생성해 정렬
정렬	Alignment	모델 출력을 인간 의도·가치에 맞추는 과정
보상 모델	Reward Model	응답의 품질·선호를 점수화하도록 학습한 모델
지속 학습	Continual / Continued Pretraining	새 도메인 데이터로 사전학습을 이어가는 것
파국적 망각	Catastrophic Forgetting	새 학습으로 이전에 알던 것을 잃는 현상
합성 데이터	Synthetic Data	모델·규칙으로 생성한 학습용 데이터

5. 효율적 파인튜닝 (PEFT)

용어	영문 / 약어	한 줄 설명
효율적 파인튜닝	PEFT (Parameter-Efficient Fine-Tuning)	전체가 아닌 소수 파라미터만 학습해 비용을 줄이는 기법군
LoRA	Low-Rank Adaptation	가중치 변화를 저랭크 행렬 두 개로 근사해 소수만 학습
QLoRA	Quantized LoRA	베이스 모델을 4비트로 양자화한 상태에서 LoRA를 학습
DoRA	Weight-Decomposed LoRA	가중치를 크기·방향으로 분해해 LoRA 성능을 끌어올린 변형
어댑터	Adapter	층 사이에 작은 학습 모듈을 끼워 넣는 PEFT 방식
프롬프트 튜닝	Prompt Tuning	입력 앞에 학습 가능한 "소프트 프롬프트" 벡터를 붙임
프리픽스 튜닝	Prefix Tuning	각 층의 키/값 앞에 학습 가능한 프리픽스를 추가
랭크	Rank (r)	LoRA 저랭크 행렬의 크기. 표현력과 비용의 트레이드오프
어댑터 병합	Merge	학습한 LoRA 가중치를 베이스에 합쳐 단일 모델로 만듦
풀 파인튜닝	Full Fine-Tuning	모든 파라미터를 갱신하는 전통적 방식(고비용)

6. 양자화·경량화·서빙 최적화

용어	영문 / 약어	한 줄 설명
양자화	Quantization	가중치·활성값을 낮은 비트(예: INT4/INT8/FP8)로 표현해 경량화
사후 양자화	PTQ (Post-Training Quantization)	학습 후 추가 학습 없이 양자화
양자화 인지 학습	QAT (Quantization-Aware Training)	양자화를 고려해 학습해 정확도 손실을 줄임
GPTQ / AWQ	GPTQ / AWQ	대표적인 사후 양자화 알고리즘(정확도 보존형)
GGUF	GGUF	llama.cpp 계열에서 쓰는 양자화 모델 파일 포맷
지식 증류	Knowledge Distillation	큰 교사 모델의 지식을 작은 학생 모델로 옮김
가지치기	Pruning	덜 중요한 가중치·연결을 제거해 경량화
KV 캐시	KV Cache	이미 계산한 키/값을 저장해 토큰 생성 속도를 높임
페이지드 어텐션	PagedAttention	KV 캐시를 페이지 단위로 관리하는 메모리 기법(vLLM)
연속 배칭	Continuous Batching	요청을 동적으로 묶어 GPU 활용도를 높이는 서빙 기법
추측 디코딩	Speculative Decoding	작은 모델이 미리 토큰을 제안해 생성을 가속
처리량 / 지연	Throughput / Latency	초당 처리량 / 응답까지 걸리는 시간
첫 토큰 지연	TTFT (Time To First Token)	요청 후 첫 토큰이 나오기까지의 시간

7. 추론·디코딩 파라미터

용어	영문 / 약어	한 줄 설명
온도	Temperature	출력 무작위성 조절. 낮으면 보수적, 높으면 다양
Top-k	Top-k Sampling	확률 상위 k개 토큰 중에서만 샘플링
Top-p	Nucleus Sampling	누적확률 p가 될 때까지의 토큰 집합에서 샘플링
그리디 디코딩	Greedy Decoding	매 단계 가장 확률 높은 토큰만 선택
빔 서치	Beam Search	여러 후보 경로를 동시에 추적해 더 나은 시퀀스 탐색
반복 페널티	Repetition / Frequency Penalty	같은 토큰 반복을 억제하는 보정
최대 토큰	Max Tokens	생성할 최대 토큰 수 제한
정지 시퀀스	Stop Sequence	특정 문자열이 나오면 생성을 멈추는 조건
펄플렉서티	Perplexity	모델이 텍스트를 얼마나 잘 예측하는지의 지표(낮을수록 좋음)
구조화 출력	Structured Output / JSON Mode	스키마(JSON 등)에 맞춰 출력하도록 강제

8. RAG·검색·벡터

용어	영문 / 약어	한 줄 설명
검색 증강 생성	RAG (Retrieval-Augmented Generation)	외부 문서를 검색해 근거로 삼아 답을 생성하는 구조
청킹	Chunking	긴 문서를 검색·임베딩 단위로 잘게 나누는 전처리
청크 오버랩	Chunk Overlap	청크 경계에서 문맥 손실을 줄이려 일부를 겹치게 자름
벡터 데이터베이스	Vector DB	임베딩 벡터를 저장·검색하는 DB (예: pgvector, Milvus)
유사도 검색	Similarity Search	질의 벡터와 가까운 벡터를 찾는 검색
코사인 유사도	Cosine Similarity	두 벡터의 방향 유사도를 재는 대표 척도
근사 최근접 이웃	ANN (Approximate Nearest Neighbor)	정확도를 조금 양보해 빠르게 가까운 벡터를 찾는 검색
HNSW	HNSW	그래프 기반의 대표적 ANN 인덱스
밀집 / 희소 검색	Dense / Sparse Retrieval	임베딩 기반 / 키워드(BM25) 기반 검색
하이브리드 검색	Hybrid Search	밀집+희소를 결합해 정확도를 높이는 검색
리랭킹	Reranking	1차 검색 결과를 더 정밀한 모델로 재정렬
재현율 / 정밀도	Recall / Precision	관련 문서를 얼마나 빠짐없이 / 정확히 가져왔는가
GraphRAG	GraphRAG	지식 그래프를 결합해 관계·요약을 강화한 RAG
컨텍스트 주입	Context Injection / Grounding	검색한 근거를 프롬프트에 넣어 답을 사실에 묶음

9. 프롬프트 엔지니어링

용어	영문 / 약어	한 줄 설명
프롬프트	Prompt	모델에 주는 입력 지시문
시스템 프롬프트	System Prompt	모델의 역할·규칙을 정하는 상위 지시
제로샷 / 퓨샷	Zero-shot / Few-shot	예시 없이 / 몇 개 예시를 주고 수행시키기
인컨텍스트 러닝	In-Context Learning	학습 없이 프롬프트의 예시만으로 작업을 학습하는 능력
생각의 사슬	CoT (Chain-of-Thought)	중간 추론 단계를 적게 해 정확도를 높이는 기법
ReAct	Reasoning + Acting	추론과 도구 사용(행동)을 번갈아 수행하는 패턴
프롬프트 템플릿	Prompt Template	변수를 끼워 재사용하는 프롬프트 양식
프롬프트 캐싱	Prompt Caching	반복되는 프롬프트 앞부분을 캐시해 비용·지연 절감
컨텍스트 엔지니어링	Context Engineering	모델에 넣을 정보(검색·기억·도구)를 설계·관리하는 작업
탈옥	Jailbreak	안전장치를 우회하도록 유도하는 프롬프트 공격
프롬프트 인젝션	Prompt Injection	외부 입력으로 지시를 덮어써 모델을 오작동시키는 공격

10. 에이전트·툴·프로토콜

용어	영문 / 약어	한 줄 설명
AI 에이전트	Agent	목표를 위해 스스로 계획·도구 사용·반복을 수행하는 시스템
툴 사용	Tool Use / Function Calling	모델이 외부 함수·API를 호출해 능력을 확장
멀티 에이전트	Multi-Agent	여러 에이전트가 역할을 나눠 협업하는 구조
오케스트레이션	Orchestration	여러 단계·에이전트·도구의 실행 흐름을 조율
메모리	Memory	대화·작업 맥락을 저장·회상하는 기능(단기/장기)
MCP	Model Context Protocol	모델과 외부 도구·데이터를 연결하는 표준 프로토콜
A2A	Agent-to-Agent	에이전트 간 상호 통신·협업을 위한 프로토콜
가드레일	Guardrails	입출력을 검증·필터링해 안전·정책을 강제하는 장치
휴먼 인 더 루프	HITL (Human-in-the-Loop)	중요한 판단에 사람의 승인·개입을 끼워 넣는 설계
자율성 수준	Autonomy Level	에이전트가 사람 개입 없이 행동하는 정도
에이전틱 워크플로	Agentic Workflow	계획→실행→검증을 반복하는 에이전트 기반 작업 흐름
계획 수립	Planning	목표를 하위 단계로 나누고 실행 순서를 세우는 에이전트 능력
작업 분해	Task Decomposition	큰 작업을 다룰 수 있는 하위 작업으로 쪼개기
반성	Reflection / Self-Critique	자기 출력을 스스로 점검·수정해 품질을 높이는 루프
서브 에이전트	Subagent	상위 에이전트가 특정 하위 작업을 위임하는 하위 에이전트
핸드오프	Handoff	한 에이전트가 다른 에이전트에게 작업·맥락을 넘기는 것
라우터	Router	요청을 적절한 도구·에이전트·모델로 분기
궤적	Trajectory	에이전트의 관찰-행동 단계들의 전체 실행 기록
도구 스키마	Tool Schema	도구의 이름·인자·타입을 정의한 명세(JSON Schema)
병렬 툴 호출	Parallel Tool Calls	여러 도구를 동시에 호출해 지연을 줄임
컴퓨터 사용	Computer Use	화면·마우스·키보드를 제어해 GUI를 직접 조작하는 능력
코드 인터프리터	Code Interpreter	샌드박스에서 코드를 실행해 계산·분석을 수행하는 도구
MCP 서버	MCP Server	도구·리소스·프롬프트를 MCP로 노출하는 외부 프로세스
MCP 클라이언트	MCP Client	MCP 서버에 연결해 도구·데이터를 사용하는 모델/호스트 측
MCP 호스트	MCP Host	MCP 클라이언트를 품고 모델과 연결하는 애플리케이션(예: IDE, 챗 앱)
MCP 전송	MCP Transport (stdio/HTTP)	MCP 통신 채널. 로컬 stdio 또는 원격 HTTP/SSE
MCP 리소스/툴/프롬프트	MCP Resource / Tool / Prompt	MCP 서버가 노출하는 3대 요소(읽을 데이터 / 실행 함수 / 프롬프트 템플릿)
A2A 에이전트 카드	A2A Agent Card	에이전트의 능력·엔드포인트를 기술해 발견을 돕는 메타데이터
A2A 태스크	A2A Task	A2A에서 에이전트 간 주고받는 작업 단위
능력 발견	Capability Discovery	다른 에이전트·도구의 기능을 동적으로 찾아내는 것
상호운용성	Interoperability	서로 다른 벤더의 에이전트·도구가 표준으로 협업하는 성질

11. 멀티모달·생성

용어	영문 / 약어	한 줄 설명
멀티모달	Multimodal	텍스트·이미지·음성 등 여러 양식을 함께 다루는 모델
비전-언어 모델	VLM (Vision-Language Model)	이미지와 텍스트를 함께 이해하는 모델
디퓨전 모델	Diffusion Model	노이즈를 점진적으로 제거해 이미지를 생성하는 방식
텍스트-이미지	Text-to-Image	텍스트 설명으로 이미지를 생성 (예: 이미지 생성 모델)
CLIP	CLIP	이미지와 텍스트를 같은 공간에 임베딩해 연결하는 모델
음성 인식	ASR (Speech-to-Text)	음성을 텍스트로 변환
음성 합성	TTS (Text-to-Speech)	텍스트를 음성으로 변환
OCR	OCR	이미지 속 문자를 텍스트로 인식
생성형 AI	Generative AI	새로운 텍스트·이미지·음성·코드를 생성하는 AI
잠재 확산	Latent Diffusion	압축된 잠재공간에서 확산을 수행해 효율을 높인 생성

12. 평가·안전·운영

용어	영문 / 약어	한 줄 설명
환각	Hallucination	사실이 아닌 내용을 그럴듯하게 생성하는 현상
그라운딩	Grounding	출력을 검증 가능한 근거(문서·데이터)에 묶는 것
벤치마크	Benchmark	표준 데이터셋으로 모델 성능을 비교하는 평가
평가	Eval	모델·시스템의 품질을 정량·정성으로 측정하는 작업
LLM 심판	LLM-as-a-Judge	다른 LLM으로 출력 품질을 채점하는 평가 방식
레드티밍	Red Teaming	의도적 공격으로 취약점·위험을 찾는 안전 점검
안전성 / 정렬세	Safety / Alignment Tax	유해 출력 억제 / 안전을 위해 감수하는 성능 손실
편향	Bias	데이터·모델에 내재한 불공정한 경향
옵저버빌리티	Observability	토큰·지연·비용·품질을 추적·모니터링
LLMOps	LLMOps	LLM 앱의 배포·평가·모니터링·운영 전반
토큰 비용	Token Cost	입력·출력 토큰 수에 비례하는 API 사용 비용
가드레일 평가	Guardrail / Policy Eval	안전·정책 준수를 점검하는 평가

13. 최신·심화 토픽

용어	영문 / 약어	한 줄 설명
전문가 혼합	MoE (Mixture of Experts)	입력마다 일부 전문가 네트워크만 활성화해 효율적으로 확장
그룹 쿼리 어텐션	GQA (Grouped-Query Attention)	키/값 헤드를 묶어 KV 캐시·메모리를 줄이는 어텐션
회전 위치 임베딩	RoPE (Rotary Position Embedding)	회전 변환으로 위치를 인코딩, 긴 문맥에 유리
플래시 어텐션	FlashAttention	메모리 접근을 최적화해 어텐션을 빠르게 계산
상태공간 모델	SSM / Mamba	어텐션 대신 상태공간으로 긴 시퀀스를 효율 처리하는 계열
롱 컨텍스트	Long Context	수십만~수백만 토큰을 다루는 긴 문맥 능력
추론 모델	Reasoning Model	답하기 전 더 오래 "생각"하도록 학습한 모델 계열
테스트타임 컴퓨트	Test-Time Compute	추론 시 연산을 더 써서 정확도를 높이는 전략
사고 토큰	Thinking / Reasoning Tokens	최종 답 이전에 생성하는 내부 추론용 토큰
컨텍스트 캐싱	Context Caching	긴 공통 컨텍스트를 캐시해 반복 요청 비용을 절감
스케일링 법칙	Scaling Laws	모델·데이터·연산 규모와 성능의 관계를 설명하는 경험칙
창발 능력	Emergent Ability	규모가 커질 때 갑자기 나타나는 능력
모델 병합	Model Merging	여러 모델 가중치를 합쳐 새 모델을 만드는 기법
에이전트 메모리	Agentic / Long-term Memory	에이전트가 세션을 넘어 정보를 저장·활용하는 메모리

14. MLOps·LLMOps

용어	영문 / 약어	한 줄 설명
MLOps	MLOps	ML 모델의 학습·배포·모니터링·운영을 자동화·표준화하는 실천
LLMOps	LLMOps	LLM 앱에 특화된 운영(프롬프트·평가·비용·안전·서빙)
모델 레지스트리	Model Registry	모델 버전·메타데이터·스테이지를 관리하는 저장소
피처 스토어	Feature Store	학습·서빙에 공통으로 쓰는 피처를 저장·제공하는 시스템
실험 추적	Experiment Tracking	하이퍼파라미터·지표·아티팩트를 기록·비교(예: MLflow)
모델 서빙	Model Serving	학습된 모델을 API·엔드포인트로 제공
데이터/모델 버저닝	Data / Model Versioning	데이터셋·모델을 버전으로 관리해 재현성 확보
재현성	Reproducibility	같은 입력·코드로 같은 결과를 다시 얻을 수 있는 성질
드리프트	Drift (Data / Concept)	데이터 분포나 정답 관계가 시간이 지나며 변하는 현상
모델 모니터링	Model Monitoring	운영 중 정확도·드리프트·이상을 추적
카나리 / 섀도 배포	Canary / Shadow Deployment	일부 트래픽에만 / 실서비스 영향 없이 새 모델을 검증
챔피언-챌린저	Champion-Challenger	운영 모델과 후보 모델을 나란히 비교 운영
A/B 테스트	A/B Test	두 버전을 트래픽 분할로 비교 평가
ML 파이프라인	ML Pipeline	데이터→학습→평가→배포를 자동화한 워크플로
모델 카드	Model Card	모델의 용도·한계·평가를 문서화한 명세
프롬프트 버저닝	Prompt Versioning	프롬프트를 버전 관리하고 회귀 평가
골든 데이터셋	Golden Dataset	회귀 평가의 기준이 되는 검증된 정답 데이터
트레이싱	Tracing (OpenTelemetry)	요청이 거치는 단계(span)를 추적해 디버깅·분석
LLM 게이트웨이	LLM Gateway	여러 모델 호출을 중앙에서 라우팅·키관리·로깅·제한
시맨틱 캐시	Semantic Cache	의미가 비슷한 요청의 결과를 캐시해 비용·지연 절감
폴백 / 라우팅	Fallback / Routing	실패·과부하 시 다른 모델로 우회하거나 분기
토큰 예산	Token Budgeting	요청·세션의 토큰 사용 상한을 관리

15. AI 보안

용어	영문 / 약어	한 줄 설명
OWASP LLM Top 10	OWASP LLM Top 10	LLM 앱의 대표 보안 위협 10가지를 정리한 표준 목록
프롬프트 인젝션	Prompt Injection	외부 입력으로 지시를 덮어써 모델을 오작동시키는 공격
간접 프롬프트 인젝션	Indirect Prompt Injection	문서·웹 등 외부 데이터에 악성 지시를 숨겨 주입
탈옥	Jailbreak	안전장치를 우회하도록 유도하는 공격
안전하지 않은 출력 처리	Insecure Output Handling	모델 출력을 검증 없이 실행·렌더해 생기는 취약점(XSS·코드 실행 등)
과도한 권한	Excessive Agency	에이전트에 과한 도구·권한을 줘 피해가 커지는 위험
데이터 유출	Data Exfiltration / Leakage	민감정보가 출력·외부 호출을 통해 새어 나가는 것
PII 노출	PII Exposure	개인식별정보가 학습·출력에 노출되는 위험
데이터 중독	Data Poisoning	학습 데이터에 악성 샘플을 섞어 모델을 오염시키는 공격
모델 추출	Model Extraction / Stealing	질의를 반복해 모델을 복제·탈취하는 공격
멤버십 추론	Membership Inference	특정 데이터가 학습에 쓰였는지 알아내는 공격
모델 역전	Model Inversion	출력으로부터 학습 데이터를 복원하려는 공격
적대적 예제	Adversarial Example	미세한 변형으로 모델을 속이는 입력
백도어 / 트로이	Backdoor / Trojan	특정 트리거에만 악의적으로 동작하도록 심은 함정
공급망 보안	Supply Chain Security	모델·데이터·의존성의 출처·무결성을 검증
모델 출처	Model Provenance	모델이 어디서 어떻게 만들어졌는지에 대한 추적 정보
샌드박싱	Sandboxing	도구·코드 실행을 격리해 피해 범위를 제한
최소 권한	Least Privilege	도구·에이전트에 꼭 필요한 권한만 부여
도구 허용/차단목록	Tool Allowlist / Denylist	호출 가능한 도구를 명시적으로 제한
콘텐츠 모더레이션	Content Moderation	유해·정책 위반 입출력을 탐지·차단
DLP	Data Loss Prevention	민감정보 유출을 탐지·차단하는 통제
프롬프트 방화벽	Prompt Firewall / Guardrails	입출력을 검사해 공격·위반을 막는 보안 계층
감사 로그	Audit Log	누가 무엇을 했는지 기록해 추적·사후분석
워터마킹	Watermarking	생성물에 식별 신호를 심어 출처를 표시
휴먼 승인	Human Approval (HITL)	위험한 행동 전에 사람의 승인을 요구하는 통제

마무리

여기까지가 현재 실무에서 가장 자주 쓰이는 AI·LLM 용어들입니다. 용어는 계속 늘어나므로 이 글도 주기적으로 업데이트할 예정입니다. 더 깊이 들어가고 싶다면, RAG·임베딩·파인튜닝·에이전트 각 주제를 다룬 사내 블로그 글들을 함께 보시길 권합니다.

용어를 외우는 것보다 중요한 건 개념 간의 관계를 잡는 것입니다. 위 "용어 지도"를 출발점으로, 한 카테고리씩 손에 익혀 가세요.