RAG

为什么需要 RAG

LLM 的知识有边界：

RAG 的价值是：把"模型凭记忆回答"变成"模型先查资料再回答"，从而让回答有据可依、更可控、更有时效性。

一句话定义：RAG（检索增强生成）是"先检索外部资料，再基于资料生成回答"的架构。

它的核心流程：

用户问题
    ↓
1. 检索：找到最相关的文档片段
    ↓
2. 增强：把片段拼进 Prompt
    ↓
3. 生成：模型基于这些资料生成答案

类比：就像考试时让你"先看参考资料，再回答问题"——参考资料就是检索来的内容。

这个流程里，"检索"是最关键的一步。关于检索的具体方式，可以看 Retrieval 词条的详细说明。

适合用 RAG 的场景：

不一定需要 RAG 的场景：

常见坑：

记住这一句：RAG 让模型"先查后答"，解决的是模型知识边界和幻觉问题——但效果取决于整条检索链路的质量，不是换一个更强的模型就能解决。

相关词条：Retrieval · Embedding