内置 150+ infoType(信用卡、SSN、各国身份证号等)
按处理字节数计费,大数据集成本高
POST /v2/projects/{projectId}/content:inspect 扫描内容找 PII;POST /content:deidentify 做脱敏。
可用率 · 30 天窗口
关于这个 API
DLP 是 GCP 的隐私保护工具。它解决的核心问题是「我的系统里哪些地方有敏感数据,怎么处理」。内置的 infoType detector 覆盖各国的常见 PII:美国 SSN、信用卡(按发卡行检测)、邮箱、电话、中国身份证号、英国 NHS 号等。可以扫描文本、表格、图片(自动 OCR 后扫),也可以直接对 BigQuery 表或 GCS bucket 做大规模扫描,生成「哪些列有什么 PII」的报告。脱敏方式很灵活——简单的 mask(XXX-XX-1234)、replace(用 fake data)、加密(可逆,需要 KMS key)、format-preserving encryption(保持长度和格式,适合数据库迁移)。是合规(GDPR、HIPAA、PCI)和数据治理场景的必备工具。
你可以做什么
- 1日志/数据库扫描发现 PII
- 2把生产数据脱敏后给开发/测试用
- 3BigQuery 表自动 PII 检测
- 4聊天机器人输入过滤
优劣对比
优点
- 内置 150+ infoType(信用卡、SSN、各国身份证号等)
- 支持多种 de-identify 方式(mask、replace、encrypt、tokenize)
- 可直接扫描 BigQuery / Cloud Storage / Datastore
注意事项
- 按处理字节数计费,大数据集成本高
- 自定义 infoType 需要 regex 或自训模型
示例请求
curl https://google.com/<endpoint>快速开始
POST /v2/projects/{projectId}/content:inspect 扫描内容找 PII;POST /content:deidentify 做脱敏。
常见问题
能识别中国身份证号吗?+
能。CHINA_RESIDENT_ID_NUMBER 是内置 infoType,准确率高(带校验位验证)。
format-preserving encryption 用在哪?+
数据库迁移场景——加密后数据保持原长度和格式(如信用卡仍是 16 位数字),下游 schema 不用改。
技术细节
- 认证方式
- unknown
- 计费
- unknown
- 协议
- REST
- SDK
- python, javascript, go, java
- 响应时间
- 44 ms
- 上次巡检
- 2026/5/12 07:37:31
更多来自 Google 的 API
Google Workspace Admin SDK API 程序化管理 Workspace 组织:用户、组、设备、域名、审计日志、组织单元。
AdMob API 可读取 accounts、apps、adUnits 与 adSources,并生成 mediation 与 network 报表。
AdSense Host API 支持 accounts、adclients、adunits、reports 和 adcode 生成,适合托管式广告平台集成。
Apigee API 可管理 API proxy、deployments、attributes 与 organizations,适合把 API 网关运维接入自动化流程。
Google BigQuery API 是 GCP 旗舰数据仓库的 REST 接口:执行 SQL 查询、管理 datasets/tables、流式插入、ML 内置。
Binary Authorization API 用于管理 attestors、IAM policy 与镜像验证流程,面向 GKE 和 Anthos 的发布门禁。
Business Profile Performance API 能拉取 location 指标时间序列和 search keyword impressions,服务 Google 商家资料分析。
Google Calendar API 让应用程序化创建、读取、更新日历事件,是日程类应用最常用的集成。
