外观
RAG架构
RAG架构
介绍
检索增强生成(RAG)的核心思想:将检索与生成相结合,以生成基于上下文的、有理有据的答案。RAG 通常包含两个阶段:
- Indexing(构建知识库阶段):将原始文档加载、切分、嵌入并存入向量数据库。
- Retrieval & Generation(检索知识库与生成阶段):接收用户查询 → 检索相关文档片段 → 将其与问题一起送入 LLM 生成答案。
LangChain 支持多种 RAG 架构,适用于不同场景。三种典型架构:2-Step RAG、Agentic RAG 和 Hybrid RAG。
2-Step RAG
两步 RAG
- 流程:用户提问 → 检索相关文档 → 将文档 + 问题送入 LLM 生成答案。
- 优点:
- 实现简单,调试容易。
- 延迟可预测(通常只需一次 LLM 调用)。
- 缺点:
- 无法处理需要多轮检索或推理的问题。
- 对模糊或复杂查询效果有限。
- 适合:静态知识库、明确问题(如“产品手册中如何重置密码?”)
Agentic RAG
智能体 RAG
- 流程:LLM 智能体在推理过程中主动调用检索工具(如查数据库、爬网页),像人类一样“边想边查”。
- 优点:
- 支持复杂、多跳推理。
- 可结合多种工具(API、SQL、文件等)。
- 缺点:
- 控制难度大,可能产生冗余或错误调用。
- 延迟不可控(取决于智能体决策步数)。
- 适合:开放式研究、跨源信息整合(如“比较 A 和 B 公司最近的财报趋势”)
Hybrid RAG
混合 RAG
- 流程:在 2-Step 基础上引入反馈与验证机制,例如:
- 查询改写:将模糊问题转为多个清晰子查询。
- 检索验证:判断召回结果是否足够相关,否则重新检索。
- 答案校验:检查生成内容是否忠实于原文,必要时重生成。
- 优点:
- 平衡了效率与准确性。
- 支持质量控制和迭代优化。
- 缺点:
- 系统更复杂,开发维护成本高。
- 适合:医疗、金融等高可靠性要求场景,或用户问题表述不清的系统。
混合检索
注意区别混合检索(Hybrid Retrieval)与 混合 RAG(Hybrid RAG)。混合检索不等同于混合 RAG 。
| 术语 | 本质 |
|---|---|
| 混合检索 | “怎么找” —— 用多种检索方法(关键词+语义)提高召回质量 |
| 混合 RAG | “怎么用” —— 用智能流程(验证、重试、修正)提高答案可靠性 |
RAG架构对比
| 架构类型 | 描述 | 控制性 | 灵活性 | 延迟 | 典型应用场景 |
|---|---|---|---|---|---|
| 2-Step RAG | 先检索,再生成。流程固定、简单直接。 | 高 | 低 | 低 | FAQ问答、文档客服机器人 |
| Agentic RAG | LLM 智能体自主决定何时、如何检索(如调用工具),动态推理。 | 低 | 高 | 可变 | 研究助手、多工具复杂任务 |
| Hybrid RAG | 结合两者优点,加入查询改写、检索验证、答案校验等中间步骤。 | 中 | 中 | 可变 | 领域专业问答、需质量保障的系统 |