Retrieval

为什么需要 Retrieval

LLM 很强，但它有个根本限制：模型的知识有截止日期，也有盲区。

它不知道：

Retrieval（检索）就是解决这个问题的技术：先找到相关资料，再让模型基于资料生成回答。模型负责"说"，Retrieval 负责"找"。

一句话定义：Retrieval 是从大量数据中找到与当前问题最相关信息的过程。

类比：Retrieval 就像图书馆管理员，听到"我想找关于量子计算入门的书"，不是给你一本书让你自己翻，而是直接找出最相关的几本递给你。

核心能力：

语义检索：把问题和文档都转成向量，根据向量相似度找最接近的内容。"按意思搜"而不是"按关键词搜"。这背后依赖的是 Embedding 技术——把文本转成数字，让计算机能比较"意思上是否接近"。

关键词检索：基于传统搜索方法（倒排索引、BM25），适合精确匹配——查人名、产品型号、错误码、订单号。

混合检索：同时结合语义检索和关键词检索，再对结果做融合。这是很多实际系统里效果最稳的方式，因为它兼顾"理解意思"和"精确命中"。

适合用 RAG 的场景：

不一定需要 RAG 的场景：

记住这一句：Retrieval 让模型"先查再答"，而不是"凭记忆回答"——它解决的是模型知识边界的问题。

相关词条：Embedding · RAG