Retrieval
为什么需要 Retrieval
LLM 很强,但它有个根本限制:模型的知识有截止日期,也有盲区。
它不知道:
- 你公司内部的私有知识库
- 昨天刚发生的新闻
- 专业领域的细分知识
Retrieval(检索)就是解决这个问题的技术:先找到相关资料,再让模型基于资料生成回答。模型负责"说",Retrieval 负责"找"。
什么是 Retrieval
一句话定义:Retrieval 是从大量数据中找到与当前问题最相关信息的过程。
类比:Retrieval 就像图书馆管理员,听到"我想找关于量子计算入门的书",不是给你一本书让你自己翻,而是直接找出最相关的几本递给你。
核心能力:
- 不是生成答案,而是定位答案的来源
- 让模型在回答时有据可依,而不是凭空发挥
怎么做:有哪些检索方式
语义检索:把问题和文档都转成向量,根据向量相似度找最接近的内容。"按意思搜"而不是"按关键词搜"。这背后依赖的是 Embedding 技术——把文本转成数字,让计算机能比较"意思上是否接近"。
关键词检索:基于传统搜索方法(倒排索引、BM25),适合精确匹配——查人名、产品型号、错误码、订单号。
混合检索:同时结合语义检索和关键词检索,再对结果做融合。这是很多实际系统里效果最稳的方式,因为它兼顾"理解意思"和"精确命中"。
什么时候用 Retrieval / RAG
适合用 RAG 的场景:
- 公司内部文档问答:模型默认不知道你的私有资料
- 实时信息问答:模型知识不是实时更新的
- 法律、医疗、金融等专业问答:需要依据资料作答,降低幻觉风险
不一定需要 RAG 的场景:
- 通用常识问答:模型本身通常已具备基础知识
- 简单的一次性生成任务:不需要外部知识
记住这一句:Retrieval 让模型"先查再答",而不是"凭记忆回答"——它解决的是模型知识边界的问题。
标签
检索语义检索向量检索信息检索