七个端点覆盖文本理解全栈:analyzeSentiment、analyzeEntities、analyzeEntitySentiment、analyzeSyntax、classifyText、moderateText、annotateText(一次返回多种结果,按各特性叠加计费)
计费按字符向上取整:标准端点每 1,000 Unicode 字符算一个 unit(含空白与 HTML 标签),ModerateText 按 100 字符;短文本高频请求会被向上取整成完整 unit,实际成本高于按请求估算的预期
打开 cloud.google.com/natural-language,在 GCP 项目里启用 Cloud Natural Language API 并绑定结算账户。本地用 `gcloud auth application-default login` 生成 ADC 凭据,CI/CD 下发 service account JSON。安装 google-cloud-language(Node.js 与 Python 包名一致),首请求建议直接打 analyzeSentiment 验证字符计费在你的流量形态下的实际成本。
可用率 · 30 天窗口
关于这个 API
Cloud Natural Language API 是 Google Cloud 在文本理解层面的核心 API,对外暴露 7 个端点:analyzeSentiment(句子级与文档级情感打分,返回 score 与 magnitude)、analyzeEntities(识别 PERSON / ORGANIZATION / LOCATION / EVENT / WORK_OF_ART / CONSUMER_GOOD 等 10 类实体并解析 Wikipedia 链接)、analyzeEntitySentiment(在实体粒度上叠加情感)、analyzeSyntax(依存句法、词性、词形还原)、classifyText(700+ 类目内容分类,长文档可用 v2 模型)、moderateText(16 类有害内容检测,覆盖 toxicity、insult、violence、sexual 等)、annotateText(一次返回多种结果,按各特性叠加计费)。计费以 1,000 Unicode 字符为一个 unit(moderateText 按 100 字符),含空白与 HTML 标签;标准端点每月前 5,000 units 免费,classifyText 30,000 units 免费,moderateText 50,000 units 免费。价格随用量阶梯下降,以 sentiment 为例,5K~1M 区间 $0.0010/unit,1M~5M 降到 $0.000500,5M+ 仅 $0.000250。默认 quota 为 600 req/min、800,000 req/day、单请求 1,000,000 bytes,超出需在 Cloud Quotas 控制台申请。客户端覆盖 8 种语言:C++、C#、Go、Java、Node.js、PHP、Python、Ruby,统一走 ADC / service account / OAuth bearer 认证。短文本高频请求会因为向上取整吃亏:一条 200 字符的请求仍按一个完整 unit 计费,能合并就合并;从按请求计费的旧服务迁过来的团队,最好先抓一段真实流量按字符回算一遍预算,再上量。
你可以做什么
- 1评论情感倾向分析:批量打分用户评论、客服工单或社交内容的 sentiment score (-1.0 ~ +1.0) 与 magnitude
- 2文档实体抽取:从合同、新闻或邮件中识别 PERSON / ORGANIZATION / LOCATION / EVENT / WORK_OF_ART / CONSUMER_GOOD 等 10 类实体,并解析 Wikipedia / MID 元数据
- 3内容分类与审核:用 ClassifyText 给知识库文章打 700+ 类目,或用 ModerateText 在 UGC 流水线上检测 16 类有害内容(toxicity、insult、violence、sexual 等)
优劣对比
优点
- 七个端点覆盖文本理解全栈:analyzeSentiment、analyzeEntities、analyzeEntitySentiment、analyzeSyntax、classifyText、moderateText、annotateText(一次返回多种结果,按各特性叠加计费)
- 价格阶梯随用量自动下降:以 sentiment 为例,5K/月免费、5K~1M 区间每 1,000 字符 $0.0010、5M+ 降到 $0.000250
- 端到端的 Google Cloud 认证体系(ADC、service account、OAuth bearer),8 种官方客户端:C++、C#、Go、Java、Node.js、PHP、Python、Ruby
注意事项
- 计费按字符向上取整:标准端点每 1,000 Unicode 字符算一个 unit(含空白与 HTML 标签),ModerateText 按 100 字符;短文本高频请求会被向上取整成完整 unit,实际成本高于按请求估算的预期
- 默认 quota 仅 600 req/min、800,000 req/day、单请求 1,000,000 bytes 上限;高并发场景需要提前在 Cloud Quotas 控制台申请上调
- 没有单一官方 GitHub 仓库,每种 SDK 分别维护在 googleapis/{lang} 多仓里,issue 跟踪与版本对齐要分头看
官方快速开始
在官方文档查看快速开始:cloud.google.com
快速开始
打开 cloud.google.com/natural-language,在 GCP 项目里启用 Cloud Natural Language API 并绑定结算账户。本地用 `gcloud auth application-default login` 生成 ADC 凭据,CI/CD 下发 service account JSON。安装 google-cloud-language(Node.js 与 Python 包名一致),首请求建议直接打 analyzeSentiment 验证字符计费在你的流量形态下的实际成本。
常见问题
Google Cloud Natural Language API 有免费额度吗?+
每个特性都有独立的月度免费额度:analyzeEntities、analyzeSentiment、analyzeEntitySentiment、analyzeSyntax 各 5,000 units,classifyText 30,000 units,moderateText 50,000 units。一个 unit 等于 1,000 个 Unicode 字符(moderateText 是 100),含空白与 HTML 标签。免费额度耗尽后按用量阶梯计费。
它和 Vertex AI / Gemini API 是什么关系?+
Cloud Natural Language API 是面向结构化文本任务的传统 ML 端点(情感、实体、句法、分类、审核),输出 JSON 结构固定、延迟稳定、按字符计费;Vertex AI 与 Gemini API 走生成式模型,能处理更开放的指令,但按 token 计费、输出非结构化。需要稳定 schema 与可预测成本就选 Natural Language API,需要灵活推理就用 Gemini。
怎么认证?+
推荐用 Application Default Credentials(ADC)。本地跑 `gcloud auth application-default login` 生成凭据,CI/CD 下发 service account JSON。所有官方客户端(C++、C#、Go、Java、Node.js、PHP、Python、Ruby)默认走 ADC,无需手写 OAuth 流程。
技术细节
- 认证方式
- oauth
- 计费
- freemium
- 速率限制
- Default project quota: 600 requests/minute, 800,000 requests/day; max 1,000,000 bytes per request
- 免费额度
- Per-feature monthly free units: 5,000 for AnalyzeEntities / AnalyzeSentiment / AnalyzeEntitySentiment / AnalyzeSyntax; 30,000 for ClassifyText; 50,000 for ModerateText. Unit = 1,000 Unicode chars (100 for ModerateText), whitespace and HTML markup included
- 协议
- REST, gRPC
- SDK
- C++, C#, Go, Java, Node.js, PHP, Python, Ruby