真正 serverless(不用管 cluster)
付费 (免费 Starter 1 index 1M vector)
pinecone.io 注册创建 index(指定 dimension)。pinecone Python client:pc.index("my-index").upsert([(id, vector, metadata), ...])
可用率 · 30 天窗口
GitHub 活跃度
关于这个 API
Pinecone 是 2019 年创办的向量数据库公司,2022 年起随着 LLM RAG 应用爆发成为这个领域的事实标准。和传统数据库存 row 不同,向量 DB 存的是高维向量(如 1536 维的 OpenAI embedding),核心操作是「找和这个向量最相似的 K 个」(cosine similarity / dot product)。RAG 应用流程:把知识库每段文字转 embedding 存 Pinecone → 用户问问题转 embedding 查 Pinecone 找最相关段落 → 把段落塞进 LLM context 让 LLM 回答。Pinecone 的差异化是「serverless 用户体验」——不像开源选择(Qdrant、Weaviate、Milvus)要自己跑 cluster,Pinecone 完全托管,开发者只关心 upsert 和 query 两个操作。缺点是不便宜——Standard 套餐 $50/月起,Enterprise 上不封顶。开源替代品在崛起,但 Pinecone 在企业 RAG 应用中仍领先。
你可以做什么
- 1LLM RAG 应用(检索增强生成)
- 2语义搜索(产品/文档/客户支持)
- 3推荐系统
- 4图像/音频相似度搜索
- 5AI agent 长期记忆
优劣对比
优点
- 真正 serverless(不用管 cluster)
- p99 < 50ms 实时查询
- metadata 过滤 + 向量相似度组合
- 稳定的 SLA
注意事项
- 付费 (免费 Starter 1 index 1M vector)
- 不开源(开源选择 Qdrant、Weaviate、Milvus)
- 迁移到自托管需要重新设计
示例请求
curl https://github.com/sigpwned/pinecone-openapi-spec/<endpoint>快速开始
pinecone.io 注册创建 index(指定 dimension)。pinecone Python client:pc.index("my-index").upsert([(id, vector, metadata), ...])
常见问题
Pinecone vs Qdrant/Weaviate/Milvus?+
托管简单:Pinecone。要开源/自托管/省钱:Qdrant 或 Weaviate。生产 RAG 应用 Pinecone 是 industry default。
metadata 怎么用?+
upsert 时和 vector 一起传 metadata(如 user_id、date),query 时加 filter(只搜某用户的文档)。
技术细节
- 认证方式
- unknown
- 计费
- unknown
- 协议
- REST, gRPC
- SDK
- python, javascript, typescript, go, java
- 响应时间
- 509 ms
- 上次巡检
- 2026/5/12 07:38:06
