AssemblyAI API
AssemblyAI API
AssemblyAI API 提供企业级语音转文字 + LLM 增强:实时和批量 transcription、说话人识别、情感分析、自动 LLM summary。
transcription 准确率行业领先(Best WER 8% 英语)
付费产品 ($0.37/小时 起)
assemblyai.com 注册拿 API key。POST /v2/transcript 提交 audio URL → 拿 transcript ID → GET /v2/transcript/{id} 拿结果。
可用率 · 30 天窗口
关于这个 API
AssemblyAI 是 2017 年创办的语音 AI 公司,专注 speech-to-text + downstream NLP。和通用 LLM 公司(OpenAI Whisper)不同,AssemblyAI 是垂直深耕:自研模型 Universal-2 在英语 WER(Word Error Rate)行业领先;提供 LLM 增强(自动 summary、entity extraction、custom topic detection);说话人识别准确(一个会议谁说了什么自动标注)。和 OpenAI Whisper 比,AssemblyAI 是付费但质量更稳定、企业 SLA 更好;Whisper 开源免费但需要自己跑 GPU 且无 diarization。客户主要是会议工具(Otter、Zoom)、客服质量平台、media 公司(字幕生成)。中文支持弱是已知限制,中文 transcription 建议 Whisper 自跑或科大讯飞、阿里云语音。
你可以做什么
- 1会议自动转录(Zoom、Google Meet 集成)
- 2电话客服质量分析
- 3podcast / YouTube 视频生成字幕
- 4医疗 / 法律 / 金融 transcription
优劣对比
优点
- transcription 准确率行业领先(Best WER 8% 英语)
- 实时 streaming 延迟低
- 附带 LLM 增强(summary、entity extraction)
- 说话人识别(diarization)准
注意事项
- 付费产品 ($0.37/小时 起)
- 中文支持较弱(专注英文 + 主流欧洲语)
- 无免费层(trial credits 短)
示例请求
curl https://www.assemblyai.com/<endpoint> \
-H "Authorization: Bearer $API_KEY"
# Some providers use X-Api-Key instead — verify in the docs.快速开始
assemblyai.com 注册拿 API key。POST /v2/transcript 提交 audio URL → 拿 transcript ID → GET /v2/transcript/{id} 拿结果。
常见问题
AssemblyAI vs Whisper?+
需要 enterprise SLA + diarization:AssemblyAI 付费。开源 + 自跑 GPU:Whisper(性价比高)。
中文怎么办?+
不建议用 AssemblyAI 做中文。Whisper 中文比较好,国内的科大讯飞和阿里云语音针对中文优化最强。
技术细节
- 认证方式
- api_key
- 计费
- paid
- 速率限制
- pay-as-you-go 无明确 RPM 限制
- 协议
- REST, WebSocket
- SDK
- python, javascript, typescript, go, java
- 响应时间
- 492 ms
- 上次巡检
- 2026/5/12 07:36:55