
Amazon Textract
Amazon Textract
Amazon Textract 是文档 OCR 与结构化抽取服务,能识别表单、表格、签名,远比传统 OCR 强大。
识别表格保留行列关系
手写识别精度低于印刷体
SDK 调 Textract.analyzeDocument(同步,小文档)或 startDocumentAnalysis(异步,大 PDF)。结果以 block 树形式返回,每个 block 是 page / line / word / key / value / cell 等类型。
可用率 · 30 天窗口
GitHub 活跃度
关于这个 API
Textract 与传统 OCR 的核心区别是结构化输出。传统 OCR 只把图片变成纯文本;Textract 还能识别这段文本在表格的哪一行哪一列、哪个 key 对应哪个 value、哪几行属于同一段。这让原本需要复杂后处理的发票、表单、合同分析变得直接。
它分几种模式:DetectDocumentText 是纯 OCR;AnalyzeDocument 加上 FORMS(key-value)、TABLES(表格)、SIGNATURES(签名检测)能力;AnalyzeExpense 专门处理发票收据;AnalyzeID 处理身份证、护照、驾照。每个模式都返回 block 树——开发者需要遍历这棵树重组业务结构(如把 table cell 拼成 2D 数组)。
中文等亚洲语言支持有限,主要服务于英文为主的文档处理场景。要处理大量中文文档建议同时评估腾讯云、阿里云的 OCR 服务。
你可以做什么
- 1发票、收据自动入账
- 2识别 PDF 表格转结构化数据
- 3简历批量解析
- 4KYC 证件信息抽取
优劣对比
优点
- 识别表格保留行列关系
- 识别表单中 key-value 对
- 专门的 Invoices / Receipts 模板模式
注意事项
- 手写识别精度低于印刷体
- 中文等亚洲语言支持有限
- 价格按页计费,海量文档处理成本可观
示例请求
curl https://github.com/mermade/aws2openapi/<endpoint> \
-H "Authorization: Bearer $API_KEY"
# Some providers use X-Api-Key instead — verify in the docs.快速开始
SDK 调 Textract.analyzeDocument(同步,小文档)或 startDocumentAnalysis(异步,大 PDF)。结果以 block 树形式返回,每个 block 是 page / line / word / key / value / cell 等类型。
常见问题
价格怎么算?+
按页计费,纯 OCR 约 $1.50/1000 页,FORMS/TABLES 模式约 $15-50/1000 页。复杂模式(如 AnalyzeExpense)更贵。
能识别中文吗?+
支持有限。打印中文部分场景能识别但效果一般,复杂版式表格不如英文。
大 PDF 怎么处理?+
用 startDocumentAnalysis 异步任务,配 SNS 通知。结果分页返回,遍历 NextToken 拉取全部。
技术细节
- 认证方式
- api_key
- 计费
- paid
- 协议
- REST
- SDK
- python, javascript, java, go, ruby, csharp
- 响应时间
- 10 ms
- 上次巡检
- 2026/5/12 07:36:34
接口端点
从 OpenAPI spec 自动解析。显示 12 / 13 个未弃用端点。
/#X-Amz-Target=Textract.AnalyzeDocument/#X-Amz-Target=Textract.AnalyzeExpense/#X-Amz-Target=Textract.AnalyzeID/#X-Amz-Target=Textract.DetectDocumentText/#X-Amz-Target=Textract.GetDocumentAnalysis/#X-Amz-Target=Textract.GetDocumentTextDetection/#X-Amz-Target=Textract.GetExpenseAnalysis/#X-Amz-Target=Textract.GetLendingAnalysis/#X-Amz-Target=Textract.GetLendingAnalysisSummary/#X-Amz-Target=Textract.StartDocumentAnalysis/#X-Amz-Target=Textract.StartDocumentTextDetection/#X-Amz-Target=Textract.StartExpenseAnalysis另有 1 个端点未显示,详见 OpenAPI spec。
更多来自 Amazon Web Services 的 API
AWS IAM Access Analyzer API 分析 IAM 资源策略找潜在的过度授权或外部访问,主动识别安全风险。
Amazon Chime SDK API 给应用嵌入实时音视频通话和聊天能力(meeting、消息、PSTN 通话)。
Amazon CloudFront 是 AWS 的 CDN 与 edge 服务,加速静态/动态内容分发,是网站性能优化的标准方案。
Amazon CloudSearch 是 AWS 的搜索引擎托管服务(已逐渐被 OpenSearch Service 取代)。
CloudWatch Application Insights API 自动监测应用问题:智能识别异常(如 SQL 慢查询、内存泄漏),减少人工配 alarm。
AWS Cognito Identity Pools API 给前端应用临时 AWS 凭证:身份联邦、guest 用户、AWS 资源直接访问。
Amazon Cognito 用户池提供托管的用户注册、登录、密码重置、MFA 等身份认证能力。
Amazon Connect Contact Lens API 用 AI 实时分析 Amazon Connect 通话:情感、关键词、合规检测、自动摘要。