AgentKnowledgeAgentKnowledgeAgentKnowledge
文档案例博客
AgentKnowledgeAgentKnowledgeAgentKnowledge

深入 Agent,构建你的专属。致力于打造体系化的 AI Agent 开发者学习平台。

学习路径

DocsAI BasicsMCPAgent 实战

社区

ShowcaseBlogGitHub

账号

User CenterLogin

© 2026 AgentKnowledge.cn. 保留所有权利。

  • Agent
  • System Prompt
  • Prompt
  • Prompt Engineering
  • Zero-shot / Few-shot
  • Chain of Thought(CoT)
  • ReAct
  • SKILL(Agent技能)
  • Memory(Agent记忆)
  • RAG
  • Retrieval
  • Embedding
  • Embedding Model
  • Vector Database
  • Cosine Similarity
  • MCP(Model Context Protocol)
  • Tool Calling
  • Function Schema
  • Structured Output
  • OpenClaw
  • Harness Engineering(驾驭工程)
  • Token
  • Context Window
  • Temperature
  • Top-p
  • Transformer 架构
  • MCP
  • Agent

Retrieval

为什么需要 Retrieval

LLM 很强,但它有个根本限制:模型的知识有截止日期,也有盲区。

它不知道:

  • 你公司内部的私有知识库
  • 昨天刚发生的新闻
  • 专业领域的细分知识

Retrieval(检索)就是解决这个问题的技术:先找到相关资料,再让模型基于资料生成回答。模型负责"说",Retrieval 负责"找"。


什么是 Retrieval

一句话定义:Retrieval 是从大量数据中找到与当前问题最相关信息的过程。

类比:Retrieval 就像图书馆管理员,听到"我想找关于量子计算入门的书",不是给你一本书让你自己翻,而是直接找出最相关的几本递给你。

核心能力:

  • 不是生成答案,而是定位答案的来源
  • 让模型在回答时有据可依,而不是凭空发挥

怎么做:有哪些检索方式

语义检索:把问题和文档都转成向量,根据向量相似度找最接近的内容。"按意思搜"而不是"按关键词搜"。这背后依赖的是 Embedding 技术——把文本转成数字,让计算机能比较"意思上是否接近"。

关键词检索:基于传统搜索方法(倒排索引、BM25),适合精确匹配——查人名、产品型号、错误码、订单号。

混合检索:同时结合语义检索和关键词检索,再对结果做融合。这是很多实际系统里效果最稳的方式,因为它兼顾"理解意思"和"精确命中"。


什么时候用 Retrieval / RAG

适合用 RAG 的场景:

  • 公司内部文档问答:模型默认不知道你的私有资料
  • 实时信息问答:模型知识不是实时更新的
  • 法律、医疗、金融等专业问答:需要依据资料作答,降低幻觉风险

不一定需要 RAG 的场景:

  • 通用常识问答:模型本身通常已具备基础知识
  • 简单的一次性生成任务:不需要外部知识

记住这一句:Retrieval 让模型"先查再答",而不是"凭记忆回答"——它解决的是模型知识边界的问题。

相关词条:Embedding · RAG

相关词条

EmbeddingCosine SimilarityRAGVector Database

标签

检索语义检索向量检索信息检索

目录

为什么需要 Retrieval什么是 Retrieval怎么做:有哪些检索方式什么时候用 Retrieval / RAG