RAG架构

检索增强生成（RAG）的核心思想：将检索与生成相结合，以生成基于上下文的、有理有据的答案。RAG 通常包含两个阶段：

LangChain 支持多种 RAG 架构，适用于不同场景。三种典型架构：2-Step RAG、Agentic RAG 和 Hybrid RAG。

两步 RAG

智能体 RAG

混合 RAG

流程：在 2-Step 基础上引入反馈与验证机制，例如：
- 查询改写：将模糊问题转为多个清晰子查询。
- 检索验证：判断召回结果是否足够相关，否则重新检索。
- 答案校验：检查生成内容是否忠实于原文，必要时重生成。
优点：
- 平衡了效率与准确性。
- 支持质量控制和迭代优化。
缺点：
- 系统更复杂，开发维护成本高。
适合：医疗、金融等高可靠性要求场景，或用户问题表述不清的系统。

注意区别混合检索（Hybrid Retrieval）与混合 RAG（Hybrid RAG）。混合检索不等同于混合 RAG 。

术语	本质
混合检索	“怎么找” —— 用多种检索方法（关键词+语义）提高召回质量
混合 RAG	“怎么用” —— 用智能流程（验证、重试、修正）提高答案可靠性

架构类型	描述	控制性	灵活性	延迟	典型应用场景
2-Step RAG	先检索，再生成。流程固定、简单直接。	高	低	低	FAQ问答、文档客服机器人
Agentic RAG	LLM 智能体自主决定何时、如何检索（如调用工具），动态推理。	低	高	可变	研究助手、多工具复杂任务
Hybrid RAG	结合两者优点，加入查询改写、检索验证、答案校验等中间步骤。	中	中	可变	领域专业问答、需质量保障的系统

RAG架构 ​