价格没变,账单涨了 35%:Claude Opus 4.7 分词器改动的真相
·5 min read
发生了什么
2026 年初,Anthropic 发布 Claude Opus 4.7,标价与 Opus 4.6 相同:输入 $5/百万 tokens,输出 $25/百万 tokens。发布标题没有提的一件事:底层分词器换了,同样的文字现在比以前多消耗 30–46% 的 tokens。
Anthropic 自己的发布说明写得很清楚:
"Opus 4.7 使用了新的分词器,改进了模型处理文本的方式。代价是:同样的输入会多产生 1.0–1.35 倍的 token,具体取决于内容类型。"
迁移指南补充道:"与 Opus 4.7 之前的模型相比,同样的内容会多出约 30% 的 token。" 接着建议开发者减小 max_tokens 或压缩输出——换句话说就是:不改代码的话,账单会涨。
具体数字
| 指标 | 数值 | 来源 |
|---|---|---|
| 官方 token 膨胀范围 | 1.0–1.35 倍 | Anthropic 发布说明 |
| 迁移指南估算 | 约多 30% | Claude 迁移文档 |
| 开发者工具实测 | 1.46 倍(相同系统提示) | Simon Willison,2026 年 4 月 |
| 实际成本增幅 | 30–46% | 由上述数据推算 |
| 每百万 token 定价(不变) | 输入 $5.00 / 输出 $25.00 | Anthropic 官方 |
算法很简单:如果你每月在 Claude Opus 4.6 上花 100 美元,切换到 Opus 4.7 后,同样的工作量不改任何代码,账单会变成 130–146 美元。
为什么这比直接涨价更危险
直接涨价是可见的——你能在定价页面看到,提前规划预算,决定是否留下。分词器变动是隐形的——定价页面还是写着 $5/百万,监控面板显示的单价没变,但每次请求消耗的 token 数量悄悄涨上去了。
唯一的察觉方式是对同一份输入在不同版本之间做 token 数量对比。大多数团队没有自动做这个,所以很多 Claude Opus 用户在没察觉的情况下默默吸收了 30–46% 的成本增幅。
哪些内容类型受影响最大
Anthropic 给出的 1.0–1.35 倍范围不是均匀分布的。根据现有数据,包含大量空白符、代码格式或混合语言的内容更容易触到膨胀范围的高端。纯英文连续散文通常在 1.0–1.1 倍区间。如果你的使用场景包含:
- 代码审查或生成(大量缩进和符号)
- 结构化数据处理(JSON、CSV、XML 输入)
- 多语言文本或混合文字
- 带格式的长系统提示
……那么你更可能碰到 35–46% 的膨胀,而不是 10–15%。
怎么检查自己的暴露程度
最快的方法:取一批代表性的实际 API 输入,分别在 Opus 4.6 和 Opus 4.7 的分词器下跑一遍,对比 token 数量。Claude API 在响应对象里会返回 token 计数——连续记录一周,切换模型后做比对。比率超过 1.1 倍,说明分词器确实在影响你。
预算规划层面:以 30% 膨胀作为现有工作负载的保守基准。如果你的场景涉及代码或结构化数据的边界情况,预算应该为 40–45%。
2026 年选模型时这意味着什么
每 token 定价是通行的比较指标——但这个指标假设同一份输入在不同模型上产生相同的 token 数量。Claude Opus 4.7 的分词器改动打破了这个假设。跨平台对比成本时,你现在需要同时考虑分词器效率,而不只是标价。
| 模型 | 输入 / 百万 tokens | 分词器膨胀(对比基准) | 实际成本系数 |
|---|---|---|---|
| Claude Opus 4.8 | $5.00 | 约 30–46%(新分词器) | 1.30–1.46 倍 |
| GPT-5.5 | $5.00 | 基准(tiktoken) | 1.0 倍 |
| DeepSeek V4 Pro | $0.435 | 与 GPT 系列相近 | 约 1.0 倍 |
| Grok 4.3 | $1.25 | 无公开数据 | 约 1.0 倍 |
⚠️ 非 Claude 模型的分词器膨胀数据未经官方发布。GPT-5.5 等使用成熟分词器家族,2026 年无报告改动。Claude Opus 4.8 继承了 Opus 4.7 的分词器。
作者:yego | 数据来源:Anthropic Opus 4.7 发布说明、Claude 迁移指南(platform.claude.com)、Simon Willison(simonwillison.net,2026 年 4 月)、BetterStack Claude Opus 4.7 指南。最后更新:2026-06-23。
常见问题
Anthropic 给 Claude Opus 4.7 涨价了吗?
官方没有。标价维持在输入 $5/百万、输出 $25/百万,与 Opus 4.6 相同。但新分词器导致同样的文本会多产生 30–46% 的 token,对大多数工作负载来说,这实质上就是同等幅度的成本增加。
Claude Opus 4.7 处理同样的输入会多用多少 token?
Anthropic 自己的发布说明写明是 1.0–1.35 倍,取决于内容类型。迁移指南估算平均约多 30%。开发者在相同系统提示上的实测记录到了 1.46 倍。
Claude Opus 4.8 有同样的问题吗?
有。Claude Opus 4.8 继承了 Opus 4.7 引入的分词器,与 4.7 之前的版本相比,30–46% 的 token 膨胀同样适用于 Opus 4.8。
哪类内容受影响最大?
代码(缩进、符号)、结构化数据(JSON、CSV、XML)、多语言混合文本,以及格式复杂的系统提示,通常会触到 35–46% 膨胀范围的高端。纯英文连续散文一般在 10–20% 区间。
这对 Claude 和 GPT-5.5 的成本对比有什么影响?
Claude Opus 4.8 和 GPT-5.5 标价都是 $5/百万 token。但 GPT-5.5 使用 tiktoken,没有报告的膨胀;Claude Opus 4.8 的分词器会让同一份输入膨胀 30–46%。对于相同工作负载,Claude Opus 4.8 的实际等效成本约为 $6.50–$7.30/百万——明显高于标价。