OCR 在多语言(含中日韩)上表现强
不做人脸识别(只检测,不识别身份)
启用 Cloud Vision API,生成 API key。调 POST https://vision.googleapis.com/v1/images:annotate 传入图片(base64 或 GCS URL)和 features 数组(LABEL_DETECTION、TEXT_DETECTION 等)。
可用率 · 30 天窗口
关于这个 API
Cloud Vision 是 Google 的图像分析服务,覆盖物体识别、OCR、人脸属性、地标识别、logo 识别、内容审核、Web 搜索(reverse image search)等多个功能。每次请求可同时启用多个 feature——一次请求拿到 labels、text、faces 全部结果,比逐项调用快。
它与 AWS Rekognition 最大的差异是政策:Google 不提供 1:N 人脸识别(detectFaces 只返回属性),主动回避了人脸识别合规风险。OCR 是它的强项之一,TEXT_DETECTION 处理稀疏文本,DOCUMENT_TEXT_DETECTION 处理密集文档(如扫描的合同),后者对中日韩等亚洲语言效果好。
Product Search 是相对小众但强大的功能——你上传一批商品图建立 product set,调用时给一张照片让 Vision 返回最相似的商品。适合电商"拍照搜同款"场景。AutoML Vision 让你上传少量标注数据训练专属分类模型,部署到 cloud 或 edge。
你可以做什么
- 1UGC 平台自动审核违规图片
- 2识别文档与手写笔记 OCR
- 3商品图自动打标签做检索
- 4识别图片地标做旅游推荐
优劣对比
优点
- OCR 在多语言(含中日韩)上表现强
- 人脸检测仅返回属性(年龄、情绪)不做识别,合规风险低
- Product Search 让你建商品图数据库做 reverse search
- AutoML Vision 用少量数据训练专属模型
注意事项
- 不做人脸识别(只检测,不识别身份)
- 某些专业领域(医学影像)需 AutoML 才达标
- 按图片次数计费,海量分析成本可观
示例请求
curl https://google.com/<endpoint> \
-H "Authorization: Bearer $API_KEY"
# Some providers use X-Api-Key instead — verify in the docs.快速开始
启用 Cloud Vision API,生成 API key。调 POST https://vision.googleapis.com/v1/images:annotate 传入图片(base64 或 GCS URL)和 features 数组(LABEL_DETECTION、TEXT_DETECTION 等)。
常见问题
免费档多少?+
每月每 feature 类型 1000 次调用免费。多 feature 同请求按多次计算。
能识别中文 OCR 吗?+
能,DOCUMENT_TEXT_DETECTION 对中文打印体识别效果好;手写体支持有限。
AWS Rekognition vs Vision 怎么选?+
在 AWS 生态里选 Rekognition;其他场景或需要更强 OCR 选 Vision。人脸识别需求只能用 Rekognition(Vision 不支持身份匹配)。
技术细节
- 认证方式
- api_key
- 计费
- paid
- 协议
- REST
- SDK
- python, javascript, java, go, ruby, csharp
- 响应时间
- 47 ms
- 上次巡检
- 2026/5/12 07:37:37
接口端点
从 OpenAPI spec 自动解析。显示 8 / 8 个未弃用端点。
/v1p1beta1/{parent}/files:annotateprojects/v1p1beta1/{parent}/files:asyncBatchAnnotateprojects/v1p1beta1/{parent}/images:annotateprojects/v1p1beta1/{parent}/images:asyncBatchAnnotateprojects/v1p1beta1/files:annotatefiles/v1p1beta1/files:asyncBatchAnnotatefiles/v1p1beta1/images:annotateimages/v1p1beta1/images:asyncBatchAnnotateimages更多来自 Google 的 API
Google Workspace Admin SDK API 程序化管理 Workspace 组织:用户、组、设备、域名、审计日志、组织单元。
AdMob API 可读取 accounts、apps、adUnits 与 adSources,并生成 mediation 与 network 报表。
AdSense Host API 支持 accounts、adclients、adunits、reports 和 adcode 生成,适合托管式广告平台集成。
Apigee API 可管理 API proxy、deployments、attributes 与 organizations,适合把 API 网关运维接入自动化流程。
Google BigQuery API 是 GCP 旗舰数据仓库的 REST 接口:执行 SQL 查询、管理 datasets/tables、流式插入、ML 内置。
Binary Authorization API 用于管理 attestors、IAM policy 与镜像验证流程,面向 GKE 和 Anthos 的发布门禁。
Business Profile Performance API 能拉取 location 指标时间序列和 search keyword impressions,服务 Google 商家资料分析。
Google Calendar API 让应用程序化创建、读取、更新日历事件,是日程类应用最常用的集成。
