AgentKnowledgeAgentKnowledgeAgentKnowledge
知识文档AI热点经典好文
AgentKnowledgeAgentKnowledgeAgentKnowledge

深入 Agent,构建你的专属。致力于打造体系化的 AI Agent 开发者学习平台。

学习路径

DocsAI BasicsAgent 工具Agent 实战

社区

GitHub

账号

User CenterLogin

© 2026 AgentKnowledge.cn. 保留所有权利。

  • Agent
  • System Prompt
  • Prompt
  • Prompt Engineering
  • Zero-shot / Few-shot
  • Chain of Thought(CoT)
  • ReAct
  • SKILL(Agent技能)
  • Memory(Agent记忆)
  • RAG
  • Retrieval
  • Embedding
  • Embedding Model
  • Vector Database
  • Cosine Similarity
  • MCP(Model Context Protocol)
  • Tool Calling
  • Function Schema
  • Structured Output
  • OpenClaw
  • Harness Engineering(驾驭工程)
  • Token
  • Context Window
  • Temperature
  • Top-p
  • Transformer 架构
  • 向量数据库
  • Embedding 模型
  • 数据源接入
  • Web Search
  • Memory 系统
  • Function Calling
  • 实战沙箱
  • 模块一 · 知识存储

    向量数据库

    Agent 的「知识仓库」。将文本转化为向量存入数据库,让 AI 能从海量文档中快速检索最相关的信息——这是 RAG 的存储侧核心。

    为什么需要向量数据库

    LLM 的知识有边界

    • • 训练数据有截止日期,无法覆盖最新业务知识
    • • 企业内部数据(文档、代码、数据库)LLM 从未见过
    • • 将整个知识库塞进 Prompt 会超出上下文窗口

    向量检索解决了什么

    • • 语义搜索:找到「意思相近」的内容,而非关键词匹配
    • • 高效:暴力搜索 O(n) → 向量索引 O(log n)
    • • 可扩展:支持数十亿级向量规模
    RAG 词条Embedding 词条向量数据库词条

    主流向量数据库对比

    Chroma

    轻量级 / 本地⭐ 简单

    适用场景:快速原型、个人项目

    优点

    • 轻量易上手
    • Python 原生
    • 快速启动

    缺点

    • 生产扩展性有限
    • 无内置分布式

    Supabase Vector

    云原生 / PG 扩展⭐⭐ 中等

    适用场景:中小型生产项目

    优点

    • 现有基础设施无缝衔接
    • 支持 pg 生态
    • Row Level Security

    缺点

    • 生态比专业向量库弱
    • 向量索引选项有限

    Milvus

    专业级 / 分布式⭐⭐⭐ 复杂

    适用场景:大规模生产环境

    优点

    • 分布式支持好
    • 性能强
    • 成熟稳定

    缺点

    • 部署复杂
    • 运维成本高

    Qdrant

    云原生 / 自托管⭐⭐ 中等

    适用场景:需要高精度的场景

    优点

    • 过滤能力强
    • API 友好
    • Rust 实现高性能

    缺点

    • 相对较新
    • 社区较小

    Pinecone

    全托管 SaaS⭐ 简单

    适用场景:不想运维的场景

    优点

    • 零运维
    • 全球分发
    • 自动扩缩容

    缺点

    • 需要付费
    • 供应商锁定

    快速上手:Supabase Vector

    如果你已经在用 Supabase(已有数据库基础设施),直接开启 pg_vector 扩展即可,无需额外部署。

    Step 1:开启扩展

    -- 在 Supabase SQL Editor 中执行 CREATE EXTENSION IF NOT EXISTS vector;

    Step 2:创建向量表

    CREATE TABLE documents ( id bigserial PRIMARY KEY, content text NOT NULL, metadata jsonb, embedding vector(1536)  -- 1536 维,与 OpenAI text-embedding-3-small 一致 );

    Step 3:创建向量索引(加速检索)

    CREATE INDEX ON documents USING ivfflat (embedding vector_cosine_ops) WITH (lists = 100);

    Step 4:TypeScript 检索示例

    import { createClient } from '@supabase/supabase-js';
    
    const supabase = createClient(SUPABASE_URL, SUPABASE_ANON_KEY);
    
    async function searchDocuments(queryEmbedding: number[]) {
      const { data } = await supabase.rpc('match_documents', {
        query_embedding: queryEmbedding,
        match_threshold: 0.78,
        match_count: 5
      });
      return data;
    }

    工程细节

    Embedding 维度选择

    维度模型特点
    1536text-embedding-3-small / ada-002性价比最高,存储和计算成本低
    3072text-embedding-3-large精度最高,适合高精度需求
    1024BGE / Cohere开源模型常用,中文场景推荐

    相似度阈值怎么设

    0.7 - 0.85

    推荐区间。高相关,结果干净。

    < 0.7

    过低,噪声多,相关性差。

    > 0.85

    过高,可能漏掉有价值的结果。

    混合搜索(Hybrid Search)

    向量检索擅长语义相似,关键词搜索(BM25)擅长精确匹配。两者结合效果最好:

    1. 向量检索:召回 Top-20(语义相关)
    2. BM25 搜索:召回 Top-20(关键词相关)
    3. RRF 融合:综合排名取 Top-5
    4. (可选)Cross-Encoder 重排:精排取 Top-3
    余弦相似度检索数据源接入(下一个模块)