
Computer Vision Client
Computer Vision Client
Bing Computer Vision API 提供图像分析:OCR、物体检测、人脸检测、场景描述、不雅内容审核。
Read API 的 OCR 质量在英文/中文上都是行业一流
人脸识别(identify)服务在 2022 年因为政策原因对新客户限制
Azure 创建 Computer Vision 资源拿 endpoint + key。POST /vision/v3.2/read/analyze 提交 OCR 任务,GET 结果。
可用率 · 30 天窗口
关于这个 API
Computer Vision 是 Azure Cognitive Services 的视觉智能 API,封装了多个能力:Read API(OCR,对手写和打印都很强)、Analyze Image(场景描述、tag 生成、品牌识别)、Detect Objects(物体边界框)、Generate Thumbnail(智能裁切)、Content Moderation(不雅、暴力检测)。每个能力都可以独立调用,不需要训练自己的模型。对比 Google Cloud Vision 和 AWS Rekognition,Microsoft 在 OCR(特别是中文手写)和场景描述质量上有传统优势。注意:Face Identify(用照片识别特定人物身份)服务从 2022 年起对新客户限制,仅有限领域可访问。
你可以做什么
- 1批量 OCR 提取图片/PDF 中文字
- 2社区 UGC 上传图片自动审核
- 3电商商品图自动打标
- 4为视障用户生成图片描述
优劣对比
优点
- Read API 的 OCR 质量在英文/中文上都是行业一流
- 同一 API 内涵盖识别、描述、审核多个能力
- 支持批量异步任务
注意事项
- 人脸识别(identify)服务在 2022 年因为政策原因对新客户限制
- 处方/医疗图像不适用于诊断
示例请求
curl https://microsoft.com/<endpoint>快速开始
Azure 创建 Computer Vision 资源拿 endpoint + key。POST /vision/v3.2/read/analyze 提交 OCR 任务,GET 结果。
常见问题
OCR 支持中文吗?+
支持。Read API v3.2+ 对简体/繁体中文都有高质量识别,包括手写。
能识别人脸身份吗?+
Face API 的 detect/group 能用,identify(身份匹配)2022 年后对新客户限制,需要申请使用资格。
一次最多能处理多大图片?+
Read API 单文件最大 500MB / 2000 页(PDF)。同步分析最大 4MB。
技术细节
- 认证方式
- unknown
- 计费
- unknown
- 协议
- REST
- SDK
- python, javascript, csharp, java, go
- 响应时间
- 307 ms
- 上次巡检
- 2026/5/12 07:37:52
更多来自 Microsoft 的 API
Bing Autosuggest API 根据用户输入的部分查询返回搜索建议词,用于搜索框 type-ahead 补全。
Bing Custom Image Search 在你自定义的网域子集内做图片搜索(Bing Custom Search 的图片版)。
Bing Custom Search 让你定义专属网域子集,在那个子集上跑 Bing 搜索——做行业垂直/企业内部搜索。
Custom Vision Prediction API 用你训练好的 Custom Vision 模型做推理:上传图片,返回分类标签和置信度。
Custom Vision Training API 程序化训练图像分类/物体检测模型:创建项目、上传图片+标签、触发训练、发布迭代。
Bing Entity Search 把查询识别为命名实体(人、地、机构)并返回结构化卡片信息(描述、图片、相关链接)。
Bing Image Search 在 Bing 全网图片索引上做搜索:按关键词、按相似图片、按 aspect ratio、按图片大小过滤。
Bing Local Business Search 按地理位置搜索本地商家(餐厅、酒店、医院),返回商家信息+地址+评分。