AI 성능을 높이는 가장 효율적인 조합, LLM과 RAG 정복하기

Notice

Recent Posts

Tags more

Archives

관리 메뉴

프로그래머가 되는 꿈

카테고리 없음

AI박사 2026. 5. 30. 21:41

LLM은 트랜스포머 아키텍처를 기반으로 방대한 데이터를 학습한 생성형 AI 모델이다. 쉽게 말해 "머리는 비상하지만, 최신 뉴스는 잘 모르는 천재 선배"에 비유할 수 있다.

핵심 원리: 다음에 올 확률이 가장 높은 단어를 예측하여 문장을 완성하는 확률적 언어 모델이다.
기술적 특징:
- 자기지도학습: 정답지 없이 스스로 언어의 구조와 상식을 독학한다.
- 창발적 능력: 파라미터가 일정 수준을 넘어서면 논리적 추론 능력이 급격히 향상된다.
치명적 한계 (할루시네이션): 진위 여부를 확인하는 시스템이 아니기에, 모르는 내용도 마치 사실인 것처럼 확신에 차서 지어내는 '환각 현상'이 발생한다.

LLM은 똑똑하지만 학습하지 않은 최신 정보는 모르고, 가끔은 없는 사실을 지어낸다. RAG는 이러한 LLM의 한계를 보완하기 위한 가장 현실적이고 강력한 대안이다.

단순히 RAG를 붙인다고 성능이 나오지는 않는다. 실무에서는 다음과 같은 정교한 설계가 필요하다.

청킹(Chunking) 전략: 문서를 적절히 쪼개는 기술이다. 너무 작으면 맥락이 끊기고, 너무 크면 검색 정확도가 떨어지므로 의미 단위로 분할하는 설계가 필수이다.
하이브리드 검색: 의미 중심의 '벡터 검색'과 단어 중심의 '키워드 검색'을 결합해 전문 용어나 고유 명사까지 정확히 찾아내도록 최적화한다.
프롬프트 제어: AI에게 "제공된 참고 자료 내에서만 답하라"는 강력한 제약 조건을 걸어 할루시네이션을 최소화한다.

RAG의 과정을 3단계 흐름으로 이해할 수 있다.

① [검색] (Retrieval): 외부 DB에서 정보 찾기

사용자가 질문을 던지면, AI는 자체 지식에만 의존하지 않고 외부 데이터베이스(Vector DB)에서 질문과 관련된 핵심 문서를 찾아낸다.

② [증강] (Augmentation): 질문과 자료의 결합

LLM은 사용자의 질문과 1단계에서 찾아낸 참고 자료(문서 조각들)를 함께 입력받는다. 이는 LLM 옆에 '참고서'를 펼쳐두는 것과 같아, AI가 정보를 보고 답할 수 있게 만든다.

③ [생성] (Generation): 근거 기반의 정확한 답변

참고 자료라는 든든한 근거를 바탕으로, LLM은 할루시네이션을 최소화하고 신뢰할 수 있는 최종 답변을 생성한다.

결국 RAG는 똑똑한 LLM이라는 '천재'에게 '참고서'를 쥐여줌으로써, 그 능력을 실무 영역까지 완벽하게 확장하는 핵심 기술이다.