프로그래머가 되는 꿈
AI 성능을 높이는 가장 효율적인 조합, LLM과 RAG 정복하기 본문
LLM (Large Language Model): AI의 ‘천재 선배’
LLM은 트랜스포머 아키텍처를 기반으로 방대한 데이터를 학습한 생성형 AI 모델이다. 쉽게 말해 "머리는 비상하지만, 최신 뉴스는 잘 모르는 천재 선배"에 비유할 수 있다.
- 핵심 원리: 다음에 올 확률이 가장 높은 단어를 예측하여 문장을 완성하는 확률적 언어 모델이다.
- 기술적 특징:
- 자기지도학습: 정답지 없이 스스로 언어의 구조와 상식을 독학한다.
- 창발적 능력: 파라미터가 일정 수준을 넘어서면 논리적 추론 능력이 급격히 향상된다.
- 치명적 한계 (할루시네이션): 진위 여부를 확인하는 시스템이 아니기에, 모르는 내용도 마치 사실인 것처럼 확신에 차서 지어내는 '환각 현상'이 발생한다.
RAG (Retrieval-Augmented Generation): AI의 ‘참고서’
LLM은 똑똑하지만 학습하지 않은 최신 정보는 모르고, 가끔은 없는 사실을 지어낸다. RAG는 이러한 LLM의 한계를 보완하기 위한 가장 현실적이고 강력한 대안이다.
1. LLM vs RAG 비교
| 구분 | 그냥 AI (LLM) | RAG 적용 AI |
| 정보 출처 | 모델 내부에 학습된 지식 | 실시간 외부 데이터베이스 |
| 최신 정보 | 불가능 (재학습 필요) | 즉시 반영 가능 |
| 신뢰도 | 할루시네이션 발생 가능 | 출처 기반으로 정확도 높음 |
| 핵심 활용 | 일반적인 대화 | 사내 데이터 검색, 전문 상담 |
2. 실무에서의 기술적 고민
단순히 RAG를 붙인다고 성능이 나오지는 않는다. 실무에서는 다음과 같은 정교한 설계가 필요하다.
- 청킹(Chunking) 전략: 문서를 적절히 쪼개는 기술이다. 너무 작으면 맥락이 끊기고, 너무 크면 검색 정확도가 떨어지므로 의미 단위로 분할하는 설계가 필수이다.
- 하이브리드 검색: 의미 중심의 '벡터 검색'과 단어 중심의 '키워드 검색'을 결합해 전문 용어나 고유 명사까지 정확히 찾아내도록 최적화한다.
- 프롬프트 제어: AI에게 "제공된 참고 자료 내에서만 답하라"는 강력한 제약 조건을 걸어 할루시네이션을 최소화한다.
3. RAG 동작 원리: ‘오픈북 테스트’ 시각화
RAG의 과정을 3단계 흐름으로 이해할 수 있다.
① [검색] (Retrieval): 외부 DB에서 정보 찾기
사용자가 질문을 던지면, AI는 자체 지식에만 의존하지 않고 외부 데이터베이스(Vector DB)에서 질문과 관련된 핵심 문서를 찾아낸다.
② [증강] (Augmentation): 질문과 자료의 결합
LLM은 사용자의 질문과 1단계에서 찾아낸 참고 자료(문서 조각들)를 함께 입력받는다. 이는 LLM 옆에 '참고서'를 펼쳐두는 것과 같아, AI가 정보를 보고 답할 수 있게 만든다.
③ [생성] (Generation): 근거 기반의 정확한 답변
참고 자료라는 든든한 근거를 바탕으로, LLM은 할루시네이션을 최소화하고 신뢰할 수 있는 최종 답변을 생성한다.
결국 RAG는 똑똑한 LLM이라는 '천재'에게 '참고서'를 쥐여줌으로써, 그 능력을 실무 영역까지 완벽하게 확장하는 핵심 기술이다.
