Google Cloud Natural Language API logo

Google Cloud Natural Language API

Google Cloud Natural Language API

未知text

Google Cloud 的文本理解 API:情感分析、实体抽取、句法、内容分类、文本审核共 7 个端点,按 Unicode 字符计费

适合什么时候用

七个端点覆盖文本理解全栈:analyzeSentiment、analyzeEntities、analyzeEntitySentiment、analyzeSyntax、classifyText、moderateText、annotateText(一次返回多种结果,按各特性叠加计费)

先注意什么

计费按字符向上取整:标准端点每 1,000 Unicode 字符算一个 unit(含空白与 HTML 标签),ModerateText 按 100 字符;短文本高频请求会被向上取整成完整 unit,实际成本高于按请求估算的预期

第一步先查

打开 cloud.google.com/natural-language,在 GCP 项目里启用 Cloud Natural Language API 并绑定结算账户。本地用 `gcloud auth application-default login` 生成 ADC 凭据,CI/CD 下发 service account JSON。安装 google-cloud-language(Node.js 与 Python 包名一致),首请求建议直接打 analyzeSentiment 验证字符计费在你的流量形态下的实际成本。

认证
oauth
CORS
?
HTTPS
注册
需要
协议
REST, gRPC
计费
freemium

可用率 · 30 天窗口

日常巡检数据收集后将在此处显示。
01

关于这个 API

Cloud Natural Language API 是 Google Cloud 在文本理解层面的核心 API,对外暴露 7 个端点:analyzeSentiment(句子级与文档级情感打分,返回 score 与 magnitude)、analyzeEntities(识别 PERSON / ORGANIZATION / LOCATION / EVENT / WORK_OF_ART / CONSUMER_GOOD 等 10 类实体并解析 Wikipedia 链接)、analyzeEntitySentiment(在实体粒度上叠加情感)、analyzeSyntax(依存句法、词性、词形还原)、classifyText(700+ 类目内容分类,长文档可用 v2 模型)、moderateText(16 类有害内容检测,覆盖 toxicity、insult、violence、sexual 等)、annotateText(一次返回多种结果,按各特性叠加计费)。计费以 1,000 Unicode 字符为一个 unit(moderateText 按 100 字符),含空白与 HTML 标签;标准端点每月前 5,000 units 免费,classifyText 30,000 units 免费,moderateText 50,000 units 免费。价格随用量阶梯下降,以 sentiment 为例,5K~1M 区间 $0.0010/unit,1M~5M 降到 $0.000500,5M+ 仅 $0.000250。默认 quota 为 600 req/min、800,000 req/day、单请求 1,000,000 bytes,超出需在 Cloud Quotas 控制台申请。客户端覆盖 8 种语言:C++、C#、Go、Java、Node.js、PHP、Python、Ruby,统一走 ADC / service account / OAuth bearer 认证。短文本高频请求会因为向上取整吃亏:一条 200 字符的请求仍按一个完整 unit 计费,能合并就合并;从按请求计费的旧服务迁过来的团队,最好先抓一段真实流量按字符回算一遍预算,再上量。

02

你可以做什么

  • 1评论情感倾向分析:批量打分用户评论、客服工单或社交内容的 sentiment score (-1.0 ~ +1.0) 与 magnitude
  • 2文档实体抽取:从合同、新闻或邮件中识别 PERSON / ORGANIZATION / LOCATION / EVENT / WORK_OF_ART / CONSUMER_GOOD 等 10 类实体,并解析 Wikipedia / MID 元数据
  • 3内容分类与审核:用 ClassifyText 给知识库文章打 700+ 类目,或用 ModerateText 在 UGC 流水线上检测 16 类有害内容(toxicity、insult、violence、sexual 等)
03

优劣对比

优点

  • 七个端点覆盖文本理解全栈:analyzeSentiment、analyzeEntities、analyzeEntitySentiment、analyzeSyntax、classifyText、moderateText、annotateText(一次返回多种结果,按各特性叠加计费)
  • 价格阶梯随用量自动下降:以 sentiment 为例,5K/月免费、5K~1M 区间每 1,000 字符 $0.0010、5M+ 降到 $0.000250
  • 端到端的 Google Cloud 认证体系(ADC、service account、OAuth bearer),8 种官方客户端:C++、C#、Go、Java、Node.js、PHP、Python、Ruby

注意事项

  • 计费按字符向上取整:标准端点每 1,000 Unicode 字符算一个 unit(含空白与 HTML 标签),ModerateText 按 100 字符;短文本高频请求会被向上取整成完整 unit,实际成本高于按请求估算的预期
  • 默认 quota 仅 600 req/min、800,000 req/day、单请求 1,000,000 bytes 上限;高并发场景需要提前在 Cloud Quotas 控制台申请上调
  • 没有单一官方 GitHub 仓库,每种 SDK 分别维护在 googleapis/{lang} 多仓里,issue 跟踪与版本对齐要分头看
04

官方快速开始

在官方文档查看快速开始:cloud.google.com

05

快速开始

打开 cloud.google.com/natural-language,在 GCP 项目里启用 Cloud Natural Language API 并绑定结算账户。本地用 `gcloud auth application-default login` 生成 ADC 凭据,CI/CD 下发 service account JSON。安装 google-cloud-language(Node.js 与 Python 包名一致),首请求建议直接打 analyzeSentiment 验证字符计费在你的流量形态下的实际成本。

06

常见问题

Google Cloud Natural Language API 有免费额度吗?+

每个特性都有独立的月度免费额度:analyzeEntities、analyzeSentiment、analyzeEntitySentiment、analyzeSyntax 各 5,000 units,classifyText 30,000 units,moderateText 50,000 units。一个 unit 等于 1,000 个 Unicode 字符(moderateText 是 100),含空白与 HTML 标签。免费额度耗尽后按用量阶梯计费。

它和 Vertex AI / Gemini API 是什么关系?+

Cloud Natural Language API 是面向结构化文本任务的传统 ML 端点(情感、实体、句法、分类、审核),输出 JSON 结构固定、延迟稳定、按字符计费;Vertex AI 与 Gemini API 走生成式模型,能处理更开放的指令,但按 token 计费、输出非结构化。需要稳定 schema 与可预测成本就选 Natural Language API,需要灵活推理就用 Gemini。

怎么认证?+

推荐用 Application Default Credentials(ADC)。本地跑 `gcloud auth application-default login` 生成凭据,CI/CD 下发 service account JSON。所有官方客户端(C++、C#、Go、Java、Node.js、PHP、Python、Ruby)默认走 ADC,无需手写 OAuth 流程。

07

技术细节

CORS: ?HTTPS: Yes注册: Yes开源: No
认证方式
oauth
计费
freemium
速率限制
Default project quota: 600 requests/minute, 800,000 requests/day; max 1,000,000 bytes per request
免费额度
Per-feature monthly free units: 5,000 for AnalyzeEntities / AnalyzeSentiment / AnalyzeEntitySentiment / AnalyzeSyntax; 30,000 for ClassifyText; 50,000 for ModerateText. Unit = 1,000 Unicode chars (100 for ModerateText), whitespace and HTML markup included
协议
REST, gRPC
SDK
C++, C#, Go, Java, Node.js, PHP, Python, Ruby
08

标签