Cloud Document AI API logo

Cloud Document AI API

Cloud Document AI API

Google Document AI API 用 ML 处理文档:OCR、表单解析、合同信息抽取、发票数据提取,预训练 + 自定义模型。

访问站点 ↗健康巡检 9 小时前
适合什么时候用

预训练 processor 覆盖发票、身份证、收据等常见类型

先注意什么

按页计费,大批量成本较高

第一步先查

GCP Console 创建 Document AI processor(选预训练或自定义类型)。POST /v1/projects/{project}/locations/{location}/processors/{processor}:process 上传文档。

认证
CORS
不支持
HTTPS
注册
?
延迟
43 ms
协议
REST
计费

可用率 · 30 天窗口

巡检: 1可用率: 100%平均延迟: 43ms
01

关于这个 API

Document AI 是 GCP 的 Intelligent Document Processing(IDP)产品,定位是「比通用 OCR 更智能」——不只是把图片转文字,而是理解文档结构和语义,提取 key-value 对、表格、签名位置、字段含义。它的产品形态是「processor」——每个 processor 是一个特定文档类型的 ML 模型,比如 Invoice Parser、ID Document Parser、Form Parser、Contract Parser。预训练 processor 开箱即用,对常见文档质量很高。复杂场景(行业特有表单)用 Document AI Workbench 训练自定义 processor,UI 上标注几十张样本即可。对比 AWS Textract 和 Azure Form Recognizer,Document AI 在某些场景(如发票字段提取)准确率行业领先。

02

你可以做什么

  • 1发票自动提取金额/账户/到期日
  • 2身份证/护照 OCR + 字段识别
  • 3合同关键条款抽取(金额、生效日期)
  • 4银行对账单自动入库
03

优劣对比

优点

  • 预训练 processor 覆盖发票、身份证、收据等常见类型
  • Workbench 工具支持自定义模型训练
  • Form Parser 通用表单解析能力强

注意事项

  • 按页计费,大批量成本较高
  • 某些特殊行业表单(如医保单据)需要自定义训练
04

示例请求

通用模板 — 实际 endpoint 请查阅文档替换 <endpoint>。
curl https://google.com/<endpoint>
05

快速开始

GCP Console 创建 Document AI processor(选预训练或自定义类型)。POST /v1/projects/{project}/locations/{location}/processors/{processor}:process 上传文档。

06

常见问题

中文文档支持如何?+

通用 OCR 和 Form Parser 中文支持很好。某些预训练 processor(如 Invoice Parser)主要针对英文,中文场景建议训自定义 processor。

Document AI 和 Cloud Vision OCR 怎么选?+

Vision OCR 适合"只要文字"。Document AI 适合"要理解结构和字段含义"。前者便宜 5-10 倍。

07

技术细节

CORS: NoHTTPS: Yes注册: ?开源: No
认证方式
unknown
计费
unknown
协议
REST
SDK
python, javascript, go, java
响应时间
43 ms
上次巡检
2026/5/12 07:37:31
08

标签

09

更多来自 Google 的 API