将文本「翻译」成数字向量的模型。Embedding 是向量数据库的上游、RAG 的起点——选对模型,检索效果提升 30% 以上。
Embedding(嵌入)是将离散符号(文字、图片、声音)映射到连续向量空间的技术。 映射后,语义相近的内容在向量空间中距离更近。
举例
「苹果」和「水果」距离 ≈ 0.12
「苹果」和「手机」距离 ≈ 0.35
「苹果」和「汽车」距离 ≈ 0.71
实际应用
• 语义搜索(不是关键词匹配)
• 相似内容推荐
• 文档去重 / 聚类
• RAG 的检索基础
适用场景:通用场景,预算有限
$0.02 / 1M tokens
1536 维
适用场景:对精度要求高的场景
$0.13 / 1M tokens
3072 维
适用场景:已有项目迁移
$0.10 / 1M tokens
1536 维
适用场景:中文场景 / 预算有限
开源免费
1024 维
适用场景:中文 RAG 场景
开源免费
1536 维
适用场景:国际化应用
$0.10 / 1M tokens
1024 维
OpenAI Embedding 的训练数据以英文为主,中文支持一般。实测在中文语义检索场景下, BGE-m3 和 M3E 的效果显著优于 OpenAI ada-002,而且完全免费。
随机选 20 个 Query,查 Top-5 结果,人工判断相关性。简单直接,适合快速验证。
准备标注数据集(有标准答案的 Query-Doc 对),跑 Recall@K / MRR 指标。客观可复现。
专业 RAG 评估工具,可评估 Retriever 的上下文召回率和 Answer 的相关性。适合生产环境。