2026 年 DashScope 定价:为什么没有「订阅套餐」,以及 Qwen 和通义万相到底多少钱
很多人搜「DashScope 订阅套餐」却什么都找不到,因为 DashScope 根本不卖套餐。它对每一次调用计量收费:Qwen 文本模型按 token 计费、单价还会随你这次请求的输入量分档跳变,通义万相的图片和视频按张、按秒计。每个模型送一份免费额度——100 万 token 或 50 张图——在你开通百炼后 90 天过期。这里是 2026 年的真实价格,以及真正能压低账单的三个杠杆。
上面是文章摘要,下面进入正文深读。可以配合目录逐段阅读,不会丢掉上下文。
上个月一位团队负责人发消息问我,该给公司卡上开哪个 DashScope 套餐。有人让他「买 Qwen-Max 的订阅」,他在阿里云控制台里找了二十分钟,想找一个有月度档位的定价页——入门版、专业版、企业版——这是每个 SaaS 工具都训练他去期待的形状。没有这个页面。他不是漏看了,他在找一个根本不存在的产品。
DashScope,也就是阿里云百炼平台的 API 入口,不卖订阅。它计量。每一次调用都按它实际消耗的量定价、计费,而人们顺手抓来的那个词——「套餐」——在这套系统里对应不到任何东西。当他们说「Qwen-Max 套餐」时,真正在选的是一个模型,而你不订阅模型,你只是调用它。就是这一个误解,让「dashscope 订阅套餐」成了一个永远找不到答案的搜索。在你看任何一个数字之前,先把这点掰正是值得的,因为它改变你做预算的方式。
没有套餐,只有一个计量表
这个心智模型能让后面一切都说得通:DashScope 是一个像电力一样的计量公用事业,不是健身房会员。你不挑一个档位然后按月付。你发请求,到了账期,按这些请求消耗的 token 和图片、用每个模型公布的单价向你收费。
这带来三个大家会漏掉的后果:
- 一个账号能调用所有模型,零承诺。 没有什么拦着你在同一个应用、同一个 key、同一个小时里,用 Qwen-Turbo 做便宜的批量活、用 Qwen3-Max 做难的请求。「档」是按请求来的,由你在调用里写哪个模型名决定。
- 闲置不花钱。 没有席位费、没有月度最低消费。这个月没流量的应用账单是零(在你过了免费额度的窗口之后)。
- 你的账单是用量形状的函数,不是你挑的一个数字。 两个团队用「同一个模型」可能成本天差地别,因为一个发短 prompt、一个往里塞 20 万 token 的上下文。这就引出了真正让人意外的部分。
Qwen 文本定价,以及藏在里面的分档陷阱
Qwen 文本模型按 token 计费,输入和输出分开定价。公式很无聊:(输入 token × 输入单价)+(输出 token × 输出单价)。不无聊的部分是,大多数模型的单价是按单次请求的输入量分档的——而且整次请求按它的输入量落在哪一档就全部按那一档计,不是只有超出的部分。
下面是国际(新加坡)部署的价格,单位是每 100 万 token 美元,截至 2026 年 5 月。在你定预算之前,永远以官方定价页为准;模型阵容和单价会变。
| 模型 | 输入(每 100 万) | 输出(每 100 万) | 免费额度 |
|---|---|---|---|
| Qwen-Turbo | $0.05 | $0.2(非思考)/ $0.5(思考) | 100 万 token,90 天 |
| Qwen-Flash | $0.05(≤256K)→ $0.25 | $0.4(≤256K)→ $2 | 100 万 token,90 天 |
| Qwen-Plus | $0.4(≤256K)→ $1.2 | $1.2(≤256K)→ $3.6 | 100 万 token,90 天 |
| Qwen3-Max | $1.2(≤32K)→ $2.4(≤128K)→ $3 | $6 → $12 → $15 | 100 万 token,90 天 |
仔细看那些箭头,因为这就是分档陷阱。在 Qwen-Plus 上,一次输入 20 万 token 的请求,输入按 $0.4/百万 计。把同一次请求推到 30 万输入,整个输入就按 $1.2/百万 计——三倍的单价,作用在全部 30 万 token 上,不是只有超过 256K 线的那 4.4 万。这个阈值是悬崖,不是斜坡。如果你离某个档位边界很近,把上下文裁到边界以下是你手里杠杆最高的省钱动作,而它在你只盯着「$0.4」这个标题数字时是看不见的。
Qwen3-Max 有三档、阶梯更密(32K,然后 128K,然后到 252K),所以在这个旗舰模型上做长上下文的活,比在 Qwen-Plus 上涨得更快。一个在长长的工具调用循环里不断把上下文养大的推理 agent,可能在一次会话里悄悄跨过两个边界。
大多数人留在桌上没拿的两个折扣
除了挑对模型、盯住分档边界,DashScope 还有两个内置杠杆能直接砍每 token 单价:
Batch 调用按五折计。 如果你的活对延迟不敏感——隔夜摘要、批量分类、数据集打标——Batch API 用同样的模型、按实时输入和输出价的一半跑。对一个不在乎某一行是 200 毫秒还是一小时完成的打标任务,这就是质量不变、成本直接砍一半。
上下文缓存给重复输入打折。 当你反复发同一段长前缀时——一个大的 system prompt、一份固定文档、few-shot 示例——上下文缓存让重复的输入 token 按折扣计。值得知道的那个坑:折扣只作用于输入,而且不和 Batch 叠加——你只能二选一。所以决策大致是:带一大段共享 prompt 的突发交互流量 → 用缓存;大型异步任务 → 用 Batch。
两者都不是你去「报名」的套餐。Batch 是一个不同的端点;缓存是请求上的一个开关。它们都是用量形状的选择——这是贯穿整个平台的主题。
通义万相:按图计价,不按 token
这里「DashScope 只有一个价」的直觉彻底破了。通义万相是阿里的图片和视频生成模型族,它活在同一个平台、同一个 API key 下——但它根本不按 token 计费,因为 token 对一张图来说是错的单位。
在中国内地(北京)部署上,通义万相 2.6 截至 2026 年 5 月的价格:
| 能力 | 价格 | 免费额度(90 天) |
|---|---|---|
| 文生图(wan2.6-t2i) | ¥0.2 / 张 | 50 张 |
| 文生视频(wan2.6-t2v) | ¥0.6/秒(720P),¥1/秒(1080P) | 50 秒 |
| 图生视频(wan2.6-i2v) | ¥0.6/秒(720P),¥1/秒(1080P) | 50 秒 |
有两点要内化。第一,免费额度算的是成功产出的图——一次失败的生成、或你为图生视频上传的输入图,不消耗额度。所以你可以在会报错的 prompt 上反复试,而不用眼看着 50 张额度往下掉。第二,单位按区域不同:上面的 Qwen 文本价是国际部署的美元,而这些万相价是内地人民币。百炼跑多个独立计费区域(内地北京、国际新加坡等),你选一个——你没法在一张账单上混着用内地的万相价和国际的 Qwen 价。如果你在给一个既做文本又做图片的产品算成本,就按你实际要部署的那个区域分别定价。
视频按秒计,意味着一段 5 秒的 1080P 片子是 ¥5,且线性放大——里面没有藏一个按片收的固定费。50 秒的免费额度大约是十段短的 720P 片子,够你在花一分钱之前评估质量。
拿 API key,因为这是你搜的另一件事
你得能调用才能定价,而 key 这一步会绊住人,因为他们去找一个不存在的「每模型 key」。流程:
- 在阿里云控制台开通 百炼(这一步激活你的免费额度,并开始 90 天倒计时)。
- 到百炼下的 API-Key 页面创建一个 key。
- 这一个 key 用于所有东西——Qwen 文本、万相图片、embedding。它是平台 key,不是每模型 key。
你把它作为 Bearer token 传。DashScope 还提供 OpenAI 兼容端点,所以如果你已经有基于 OpenAI SDK 的代码,往往一行都不用重写:把 base URL 指向 DashScope 的兼容端点,换上你的 key,把模型名改成 qwen-plus 或你想要的那个。key 放在服务端。免费额度一过期,这个 key 就在花真钱,而泄露的 key 会把钱花在别人的 prompt 上。
那你到底该怎么做预算?
把「套餐」这个词丢掉,按计量表的方式做预算:
- 做原型: ¥0 / $0。头 90 天靠免费额度活着——每个 Qwen 模型 100 万 token、万相 50 张图。这足够你验证大多数想法,一分钱不花。
- 便宜的大批量文本: Qwen-Turbo 或 Qwen-Flash,把请求压在第一档边界以下,异步的活全走 Batch。这是地板价,而且是真的便宜——一次典型请求几分钱的零头。
- 质量关键的文本: 平衡用 Qwen-Plus,只把最难的请求给 Qwen3-Max。盯住分档悬崖;上旗舰模型前做一遍上下文裁剪,自己就把成本赚回来了。
- 图片和视频: 按 ¥0.2/张、视频 ¥0.6–1/秒做预算,人民币,内地部署。一旦你知道自己的量,就是线性、可预测的。
「dashscope 价格结构」之所以是个让人迷糊的搜索,不是因为价格藏起来了。是因为根本没有单一结构——文本有一个带分档悬崖和两个折扣的 token 计量表,媒体有一个按张、按秒的计量表,还在不同区域用不同币种计费。一旦你把它看成计量公用事业而不是订阅,那些数字就不再是迷宫,而开始是一个你能控制的函数。
快速跳到对应段落
下一步
读完后可以继续回到工具目录,对比具体产品。
去看工具