Blog

How to use RAG (Retrieval Augmented Generation)

Retrieval Augmented Generation(RAG)을 활용해 AI 응답의 정확도와 맥락을 향상시키는 방법을 알아보세요. RAG 통합의 핵심 기술을 배워보세요.

2025년 01월 14일

RAG(Retrieval Augmented Generation)

개요

이 유뷰브 튜토리얼은 Dify 에서 제공하는 RAG(Retrieval Augmented Generation) 파이프라인을 이용해 AI 개인 비서 애플리케이션의 성능을 향상시키는 방법을 소개합니다.

사용자는 다양한 지식 기반에서 외부 지식을 활용하여 더 정확하고 효과적인 응답을 생성할 수 있습니다. 기본 설정을 유지하며 데이터 전처리와 청소 단계를 수행한 후, 여러 검색 모드를 통해 최적의 결과를 얻을 수 있습니다.

이 시스템은 특히 다중 지식 검색을 가능하게 하여 아이디어의 실현을 돕는 강력한 도구입니다. RAG 시스템을 통해 AI의 응답 품질을 높이고 사용자 경험을 향상시킬 수 있는 기회를 제공합니다.

주요 용어

RAG (Retrieval Augmented Generation: 검색 증강 생성)

  • RAG는 ‘Retrieval Augmented Generation’의 약자로, 정보를 찾고 그것을 생성하는 AI 시스템을 의미합니다. 즉, AI가 필요한 정보를 검색하고 그 정보를 바탕으로 더 나은 응답을 생성할 수 있도록 돕는 기술입니다. 이 시스템은 AI 개인 비서가 사용자의 질문에 대해 더 정확한 답변을 제공할 수 있게 해줍니다.
  • AI가 이미 가진 지식과 외부에서 얻은 정보를 결합하는 방법입니다. 예를 들어, 학생이 공부할 때 이미 알고 있는 지식과 참고서에서 찾은 정보를 합쳐서 더 깊이 있는 답변을 만드는 것과 같습니다.

RAG 아키텍처 사용법

RAG 아키텍처 사용법
  • RAG는 인공지능 비서의 응답 향상에 기여하며, 외부 지식을 통해 관련 문서에서 정보를 찾아 사용자 질문에 답할 수 있도록 돕는다.
  • 데이터 가져오기를 위해 계정에 로그인한 후 ‘Knowledge’로 이동하고 ‘Create Knowledge’를 클릭하여 파일에서 데이터를 가져온다.
  • 문서는 쪼개기 설정, 인덱스 모드, 검색 설정을 통해 전처리 및 정리되며, 처음 시도 시 기본 설정을 사용하는 것이 권장된다.
  • 쪼개기 설정은 문서를 개별 단락으로 나누어 사용자 질문과 관련된 텍스트 세그먼트가 일치하도록 한다.

RAG 파이프라인 최적화

RAG 파이프라인 최적화
  • Dify는 사용자가 청킹, 인덱싱, 검색 설정을 쉽게 조정할 수 있게 하여 최적의 RAG 파이프라인을 구축할 수 있도록 지원합니다.
  • 이를 통해 RAG 시스템의 전반적인 성능을 향상시킬 수 있습니다.
  • Dify의 이러한 기능들은 RAG 아키텍처의 핵심 단계인 검색(Retrieval)과 증강(Augmentation)을 효과적으로 지원하며, 결과적으로 AI 어시스턴트의 응답 품질을 크게 향상시키는 데 중요한 역할을 합니다.

RAG 시스템 소개와 설정 방법

RAG 시스템 소개와 설정 방법
  • 고품질 모드에서는 OpenAI 임베디드 모델을 활용하여 사용자 쿼리 처리의 정확성을 향상시킨다.
  • 경제 모드는 키워드 인덱스와 같은 오프라인 벡터 엔진을 사용하여 비용을 낮추지만 정확성은 떨어진다.
  • 고품질 모드에서는 벡터 검색, 전체 텍스트 검색, 하이브리드 검색 중 선택할 수 있으며 , 하이브리드 검색이 장점이 가장 많다고 추천한다.
  • 하이브리드 검색은 전체 텍스트 검색과 벡터 검색을 동시에 수행하고, 그래서 가장 적합한 결과를 다시 순위 매긴다.
  • API 키를 구성해야 하며, 모든 설정이 완료된 후 저장하고 처리하여 자신만의 RAG 데이터베이스를 생성할 수 있다.

Knowledge Context 접근하기

Knowledge Context 접근하기
  • 지식 контекст를 보조 도구나 텍스트 생성기로 가져온 후, 해당 도구는 파일의 외부 지식에 접근할 수 있게 된다.
  • 이 외부 지식은 보조 도구가 사용할 컨텍스트로 작용한다.

RAG의 검색 모드 설정

RAG의 검색 모드 설정
  • 지식 기반이 여러 개 추가된 경우, N-to-one 검색 모드Multipath 검색 모드 중에서 선택할 수 있다.
  • N-to-one 모드는 소규모 지식 기반에 적합하며, 모델의 추론 능력을 이용하여 사용자 의도에 가장 관련 있는 지식 기반을 선택한다.
  • Multipath 검색 모드는 여러 지식 기반에서 관련 텍스트 청크를 쿼리할 수 있으며
  • 이 모드는 모델의 추론 능력이나 지식 설명에 의존하지 않고, 재순위 모델을 사용하여 사용자 질문에 가장 적합한 결과를 선택한다.
  • 여러 지식 기반을 가진 애플리케이션을 만들 때는 Multipath 검색 모드 사용이 권장된다.

RAG 시스템 설정 방법

 RAG 시스템 설정 방법
  • 지식 베이스의 테스트 과정은 복잡하지 않기 때문에 걱정할 필요가 없다.
  • 애플리케이션 내에서 청크(chunking), 색인(indexing), 및 검색(retrieval) 설정을 변경하여 최상의 결과를 주는 구성을 테스트할 수 있다.
  • RAG 시스템을 자신의 앱에서 사용하는 방법을 설명하고 있다.
  • 더 많은 정보는 설명란의 링크를 통해 확인할 수 있으며, DeFi 사용 사례에 대한 내용이 포함되어 있다.
  • Discord 링크도 설명란에 있으며, 사용자들의 창의성을 기대하고 있다.

마무리

Dify의 RAG 구현은 AI 어시스턴트의 응답 품질을 크게 향상시키는 데 중요한 역할을 합니다. 외부 지식을 효과적으로 활용하고, 다양한 검색 및 최적화 옵션을 제공함으로써 Dify는 RAG 아키텍처의 잠재력을 최대한 활용할 수 있게 해줍니다.

References & Related Links

Share This Story, Choose Your Platform!