模块一 · 知识存储

向量数据库

Agent 的「知识仓库」。将文本转化为向量存入数据库，让 AI 能从海量文档中快速检索最相关的信息——这是 RAG 的存储侧核心。

为什么需要向量数据库

LLM 的知识有边界

• 训练数据有截止日期，无法覆盖最新业务知识
• 企业内部数据（文档、代码、数据库）LLM 从未见过
• 将整个知识库塞进 Prompt 会超出上下文窗口

向量检索解决了什么

• 语义搜索：找到「意思相近」的内容，而非关键词匹配
• 高效：暴力搜索 O(n) → 向量索引 O(log n)
• 可扩展：支持数十亿级向量规模

RAG 词条 Embedding 词条向量数据库词条

主流向量数据库对比

Chroma

轻量级 / 本地⭐ 简单

适用场景：快速原型、个人项目

优点

轻量易上手
Python 原生
快速启动

缺点

生产扩展性有限
无内置分布式

Supabase Vector

云原生 / PG 扩展⭐⭐ 中等

适用场景：中小型生产项目

优点

现有基础设施无缝衔接
支持 pg 生态
Row Level Security

缺点

生态比专业向量库弱
向量索引选项有限

Milvus

专业级 / 分布式⭐⭐⭐ 复杂

适用场景：大规模生产环境

优点

分布式支持好
性能强
成熟稳定

缺点

部署复杂
运维成本高

Qdrant

云原生 / 自托管⭐⭐ 中等

适用场景：需要高精度的场景

优点

过滤能力强
API 友好
Rust 实现高性能

缺点

相对较新
社区较小

Pinecone

全托管 SaaS⭐ 简单

适用场景：不想运维的场景

优点

零运维
全球分发
自动扩缩容

缺点

需要付费
供应商锁定

快速上手：Supabase Vector

如果你已经在用 Supabase（已有数据库基础设施），直接开启 pg_vector 扩展即可，无需额外部署。

Step 1：开启扩展

-- 在 Supabase SQL Editor 中执行 CREATE EXTENSION IF NOT EXISTS vector;

Step 2：创建向量表

CREATE TABLE documents ( id bigserial PRIMARY KEY, content text NOT NULL, metadata jsonb, embedding vector(1536)  -- 1536 维，与 OpenAI text-embedding-3-small 一致 );

Step 3：创建向量索引（加速检索）

CREATE INDEX ON documents USING ivfflat (embedding vector_cosine_ops) WITH (lists = 100);

Step 4：TypeScript 检索示例

import { createClient } from '@supabase/supabase-js';

const supabase = createClient(SUPABASE_URL, SUPABASE_ANON_KEY);

async function searchDocuments(queryEmbedding: number[]) {
  const { data } = await supabase.rpc('match_documents', {
    query_embedding: queryEmbedding,
    match_threshold: 0.78,
    match_count: 5
  });
  return data;
}

工程细节

Embedding 维度选择

维度	模型	特点
1536	text-embedding-3-small / ada-002	性价比最高，存储和计算成本低
3072	text-embedding-3-large	精度最高，适合高精度需求
1024	BGE / Cohere	开源模型常用，中文场景推荐

相似度阈值怎么设

0.7 - 0.85

推荐区间。高相关，结果干净。

< 0.7

过低，噪声多，相关性差。

> 0.85

过高，可能漏掉有价值的结果。

混合搜索（Hybrid Search）

向量检索擅长语义相似，关键词搜索（BM25）擅长精确匹配。两者结合效果最好：

向量检索：召回 Top-20（语义相关）
BM25 搜索：召回 Top-20（关键词相关）
RRF 融合：综合排名取 Top-5
（可选）Cross-Encoder 重排：精排取 Top-3

余弦相似度检索数据源接入（下一个模块）