2025-03-31

RAG: 검색 증강 생성(Retrieval-Augmented Generation) 입문

1. RAG란 무엇인가?

RAG(Retrieval-Augmented Generation)는 거대 언어 모델(LLM)이 가진 지식의 한계를 극복하기 위해, 외부 데이터베이스에서 관련 정보를 검색(Retrieval)해온 뒤 이를 기반으로 답변을 생성(Generation)하는 기술입니다.

2. 왜 RAG가 필요한가?

최신성 유지: LLM은 학습 시점 이후의 정보는 알지 못하지만, RAG는 최신 문서나 뉴스를 검색해서 답변에 활용할 수 있습니다.
할루시네이션(환각) 방지: 모델이 지어내는 대신, 실제 논문이나 매뉴얼 등 “근거”를 바탕으로 답변하므로 훨씬 정확합니다.
보안 및 사내 지식 활용: 인터넷에 공개되지 않은 회사의 문서나 개인 데이터를 안전하게 프롬프트에 포함하여 활용할 수 있습니다.

3. 구현을 위한 준비물 (Python 기준)

Vector Database: 데이터를 효율적으로 저장하고 검색하기 위한 DB (예: ChromaDB).
Framework: LLM과 검색 기능을 연결해 주는 도구 (예: LangChain).
Embedding Model: 문장을 고차원 벡터로 변환해 주는 모델.

최근에는 Ollama 등을 활용하여 로컬 환경에서 나만의 RAG 시스템을 구축하는 것이 활발히 연구되고 있습니다.