LlamaIndex Cloud / LlamaParse API
LlamaIndex Cloud / LlamaParse API
LlamaIndex Cloud / LlamaParse API 专注 RAG 数据 pipeline:复杂 PDF / 文档解析、文档转 LLM-ready 结构化数据。
LlamaParse 在复杂 PDF(表格 + 图表)上效果远超 pdfplumber 等开源
复杂 PDF 解析按页付费 ($0.003/page),大批量贵
cloud.llamaindex.ai 注册拿 API key。Python:from llama_parse import LlamaParse; parser.load_data(["doc.pdf"])
可用率 · 30 天窗口
关于这个 API
LlamaIndex 是 2022 年 Jerry Liu 创办的开源项目(早期叫 GPT Index),和 LangChain 并列是 LLM 应用 framework 双雄。如果说 LangChain 是「LLM 应用通用 framework」(chain / agent / RAG / 一切),LlamaIndex 是「专注 RAG 数据侧」——更深入 ingestion、indexing、retrieval 这套 RAG pipeline。商业化通过 LlamaCloud 提供 SaaS 服务:(1) LlamaParse - 解析复杂 PDF(含表格、图表、扫描件),输出 LLM-ready markdown 或 JSON,质量行业领先(金融 10-K 报告、医疗论文等复杂文档解析效果远超开源工具);(2) LlamaCloud 托管 vector index pipeline——数据接入、embedding、index、查询全托管,企业 RAG 应用免运维。客户偏 enterprise RAG(金融、法律、医疗等需要处理复杂文档的领域)。
你可以做什么
- 1复杂 PDF(含表格、图表)解析给 LLM 做 RAG
- 2金融报告 / 法律合同 / 研究论文结构化
- 3enterprise knowledge base ingestion
- 4多源数据 (PDF / Word / 网页) 统一 ingest
优劣对比
优点
- LlamaParse 在复杂 PDF(表格 + 图表)上效果远超 pdfplumber 等开源
- LlamaIndex Python 库是 RAG 领域和 LangChain 并列双雄
- 提供 LlamaCloud SaaS 托管数据 pipeline
注意事项
- 复杂 PDF 解析按页付费 ($0.003/page),大批量贵
- 生态比 LangChain 略小
示例请求
curl https://www.llamaindex.ai/<endpoint> \
-H "Authorization: Bearer $API_KEY"
# Some providers use X-Api-Key instead — verify in the docs.快速开始
cloud.llamaindex.ai 注册拿 API key。Python:from llama_parse import LlamaParse; parser.load_data(["doc.pdf"])
常见问题
LlamaIndex vs LangChain?+
RAG-focused 应用 LlamaIndex 更深入;通用 LLM 应用 LangChain 生态更全。许多项目两个 lib 都用。
LlamaParse 比开源 pdfplumber 强多少?+
复杂 PDF(嵌套表格、图表、扫描件)效果完全不同档次。但简单 PDF 开源工具足够。
技术细节
- 认证方式
- api_key
- 计费
- freemium
- 速率限制
- LlamaParse free 1000 pages/天;商业按页计费
- 协议
- REST
- SDK
- python, typescript