AssemblyAI API logo

AssemblyAI API

AssemblyAI API

AssemblyAI API 提供企业级语音转文字 + LLM 增强:实时和批量 transcription、说话人识别、情感分析、自动 LLM summary。

访问站点 ↗文档 ↗健康巡检 9 小时前
适合什么时候用

transcription 准确率行业领先(Best WER 8% 英语)

先注意什么

付费产品 ($0.37/小时 起)

第一步先查

assemblyai.com 注册拿 API key。POST /v2/transcript 提交 audio URL → 拿 transcript ID → GET /v2/transcript/{id} 拿结果。

认证
api_key
CORS
?
HTTPS
注册
?
延迟
492 ms
协议
REST, WebSocket
计费
paid

可用率 · 30 天窗口

巡检: 1可用率: 100%平均延迟: 492ms
01

关于这个 API

AssemblyAI 是 2017 年创办的语音 AI 公司,专注 speech-to-text + downstream NLP。和通用 LLM 公司(OpenAI Whisper)不同,AssemblyAI 是垂直深耕:自研模型 Universal-2 在英语 WER(Word Error Rate)行业领先;提供 LLM 增强(自动 summary、entity extraction、custom topic detection);说话人识别准确(一个会议谁说了什么自动标注)。和 OpenAI Whisper 比,AssemblyAI 是付费但质量更稳定、企业 SLA 更好;Whisper 开源免费但需要自己跑 GPU 且无 diarization。客户主要是会议工具(Otter、Zoom)、客服质量平台、media 公司(字幕生成)。中文支持弱是已知限制,中文 transcription 建议 Whisper 自跑或科大讯飞、阿里云语音。

02

你可以做什么

  • 1会议自动转录(Zoom、Google Meet 集成)
  • 2电话客服质量分析
  • 3podcast / YouTube 视频生成字幕
  • 4医疗 / 法律 / 金融 transcription
03

优劣对比

优点

  • transcription 准确率行业领先(Best WER 8% 英语)
  • 实时 streaming 延迟低
  • 附带 LLM 增强(summary、entity extraction)
  • 说话人识别(diarization)准

注意事项

  • 付费产品 ($0.37/小时 起)
  • 中文支持较弱(专注英文 + 主流欧洲语)
  • 无免费层(trial credits 短)
04

示例请求

通用模板 — 实际 endpoint 请查阅文档替换 <endpoint>。
curl https://www.assemblyai.com/<endpoint> \
  -H "Authorization: Bearer $API_KEY"
# Some providers use X-Api-Key instead — verify in the docs.
05

快速开始

assemblyai.com 注册拿 API key。POST /v2/transcript 提交 audio URL → 拿 transcript ID → GET /v2/transcript/{id} 拿结果。

06

常见问题

AssemblyAI vs Whisper?+

需要 enterprise SLA + diarization:AssemblyAI 付费。开源 + 自跑 GPU:Whisper(性价比高)。

中文怎么办?+

不建议用 AssemblyAI 做中文。Whisper 中文比较好,国内的科大讯飞和阿里云语音针对中文优化最强。

07

技术细节

CORS: ?HTTPS: Yes注册: ?开源: No
认证方式
api_key
计费
paid
速率限制
pay-as-you-go 无明确 RPM 限制
协议
REST, WebSocket
SDK
python, javascript, typescript, go, java
响应时间
492 ms
上次巡检
2026/5/12 07:36:55
08

标签