文档案例博客

深入 Agent，构建你的专属。致力于打造体系化的 AI Agent 开发者学习平台。

学习路径

Docs AI Basics MCP Agent 实战

社区

Showcase Blog GitHub

账号

User Center Login

© 2026 AgentKnowledge.cn. 保留所有权利。

Agent
System Prompt
Prompt
Prompt Engineering
Zero-shot / Few-shot
Chain of Thought（CoT）
ReAct
SKILL（Agent技能）
Memory（Agent记忆）
RAG
Retrieval
Embedding
Embedding Model
Vector Database
Cosine Similarity
MCP（Model Context Protocol）
Tool Calling
Function Schema
Structured Output
OpenClaw
Harness Engineering（驾驭工程）
Token
Context Window
Temperature
Top-p
Transformer 架构

MCP

Agent

Retrieval

为什么需要 Retrieval

LLM 很强，但它有个根本限制：模型的知识有截止日期，也有盲区。

它不知道：

你公司内部的私有知识库
昨天刚发生的新闻
专业领域的细分知识

Retrieval（检索）就是解决这个问题的技术：先找到相关资料，再让模型基于资料生成回答。模型负责"说"，Retrieval 负责"找"。

什么是 Retrieval

一句话定义：Retrieval 是从大量数据中找到与当前问题最相关信息的过程。

类比：Retrieval 就像图书馆管理员，听到"我想找关于量子计算入门的书"，不是给你一本书让你自己翻，而是直接找出最相关的几本递给你。

核心能力：

不是生成答案，而是定位答案的来源
让模型在回答时有据可依，而不是凭空发挥

怎么做：有哪些检索方式

语义检索：把问题和文档都转成向量，根据向量相似度找最接近的内容。"按意思搜"而不是"按关键词搜"。这背后依赖的是 Embedding 技术——把文本转成数字，让计算机能比较"意思上是否接近"。

关键词检索：基于传统搜索方法（倒排索引、BM25），适合精确匹配——查人名、产品型号、错误码、订单号。

混合检索：同时结合语义检索和关键词检索，再对结果做融合。这是很多实际系统里效果最稳的方式，因为它兼顾"理解意思"和"精确命中"。

什么时候用 Retrieval / RAG

适合用 RAG 的场景：

公司内部文档问答：模型默认不知道你的私有资料
实时信息问答：模型知识不是实时更新的
法律、医疗、金融等专业问答：需要依据资料作答，降低幻觉风险

不一定需要 RAG 的场景：

通用常识问答：模型本身通常已具备基础知识
简单的一次性生成任务：不需要外部知识

记住这一句：Retrieval 让模型"先查再答"，而不是"凭记忆回答"——它解决的是模型知识边界的问题。

相关词条：Embedding · RAG

相关词条

Embedding Cosine Similarity RAG Vector Database

标签

检索语义检索向量检索信息检索

目录

为什么需要 Retrieval 什么是 Retrieval 怎么做：有哪些检索方式什么时候用 Retrieval / RAG