Skip to content

RAG架构

RAG架构

介绍

检索增强生成(RAG)的核心思想:将检索与生成相结合,以生成基于上下文的、有理有据的答案。RAG 通常包含两个阶段:

  • Indexing(构建知识库阶段):将原始文档加载、切分、嵌入并存入向量数据库。
  • Retrieval & Generation(检索知识库与生成阶段):接收用户查询 → 检索相关文档片段 → 将其与问题一起送入 LLM 生成答案。

LangChain 支持多种 RAG 架构,适用于不同场景。三种典型架构:2-Step RAG、Agentic RAG 和 Hybrid RAG。

2-Step RAG

两步 RAG

  • 流程:用户提问 → 检索相关文档 → 将文档 + 问题送入 LLM 生成答案。
  • 优点:
    • 实现简单,调试容易。
    • 延迟可预测(通常只需一次 LLM 调用)。
  • 缺点:
    • 无法处理需要多轮检索或推理的问题。
    • 对模糊或复杂查询效果有限。
  • 适合:静态知识库、明确问题(如“产品手册中如何重置密码?”)

Agentic RAG

智能体 RAG

  • 流程:LLM 智能体在推理过程中主动调用检索工具(如查数据库、爬网页),像人类一样“边想边查”。
  • 优点:
    • 支持复杂、多跳推理。
    • 可结合多种工具(API、SQL、文件等)。
  • 缺点:
    • 控制难度大,可能产生冗余或错误调用。
    • 延迟不可控(取决于智能体决策步数)。
  • 适合:开放式研究、跨源信息整合(如“比较 A 和 B 公司最近的财报趋势”)

Hybrid RAG

混合 RAG

  • 流程:在 2-Step 基础上引入反馈与验证机制,例如:
    • 查询改写:将模糊问题转为多个清晰子查询。
    • 检索验证:判断召回结果是否足够相关,否则重新检索。
    • 答案校验:检查生成内容是否忠实于原文,必要时重生成。
  • 优点:
    • 平衡了效率与准确性。
    • 支持质量控制和迭代优化。
  • 缺点:
    • 系统更复杂,开发维护成本高。
  • 适合:医疗、金融等高可靠性要求场景,或用户问题表述不清的系统。

混合检索

注意区别混合检索(Hybrid Retrieval)与 混合 RAG(Hybrid RAG)。混合检索不等同于混合 RAG 。

术语本质
混合检索“怎么找” —— 用多种检索方法(关键词+语义)提高召回质量
混合 RAG“怎么用” —— 用智能流程(验证、重试、修正)提高答案可靠性

RAG架构对比

架构类型描述控制性灵活性延迟典型应用场景
2-Step RAG先检索,再生成。流程固定、简单直接。FAQ问答、文档客服机器人
Agentic RAGLLM 智能体自主决定何时、如何检索(如调用工具),动态推理。可变研究助手、多工具复杂任务
Hybrid RAG结合两者优点,加入查询改写、检索验证、答案校验等中间步骤。可变领域专业问答、需质量保障的系统

参考资料