价格没变,账单涨了 35%:Claude Opus 4.7 分词器改动的真相

·5 min read

发生了什么

2026 年初,Anthropic 发布 Claude Opus 4.7,标价与 Opus 4.6 相同:输入 $5/百万 tokens,输出 $25/百万 tokens。发布标题没有提的一件事:底层分词器换了,同样的文字现在比以前多消耗 30–46% 的 tokens。

Anthropic 自己的发布说明写得很清楚:

"Opus 4.7 使用了新的分词器,改进了模型处理文本的方式。代价是:同样的输入会多产生 1.0–1.35 倍的 token,具体取决于内容类型。"

迁移指南补充道:"与 Opus 4.7 之前的模型相比,同样的内容会多出约 30% 的 token。" 接着建议开发者减小 max_tokens 或压缩输出——换句话说就是:不改代码的话,账单会涨。

具体数字

指标数值来源
官方 token 膨胀范围1.0–1.35 倍Anthropic 发布说明
迁移指南估算约多 30%Claude 迁移文档
开发者工具实测1.46 倍(相同系统提示)Simon Willison,2026 年 4 月
实际成本增幅30–46%由上述数据推算
每百万 token 定价(不变)输入 $5.00 / 输出 $25.00Anthropic 官方

算法很简单:如果你每月在 Claude Opus 4.6 上花 100 美元,切换到 Opus 4.7 后,同样的工作量不改任何代码,账单会变成 130–146 美元。

为什么这比直接涨价更危险

直接涨价是可见的——你能在定价页面看到,提前规划预算,决定是否留下。分词器变动是隐形的——定价页面还是写着 $5/百万,监控面板显示的单价没变,但每次请求消耗的 token 数量悄悄涨上去了。

唯一的察觉方式是对同一份输入在不同版本之间做 token 数量对比。大多数团队没有自动做这个,所以很多 Claude Opus 用户在没察觉的情况下默默吸收了 30–46% 的成本增幅。

哪些内容类型受影响最大

Anthropic 给出的 1.0–1.35 倍范围不是均匀分布的。根据现有数据,包含大量空白符、代码格式或混合语言的内容更容易触到膨胀范围的高端。纯英文连续散文通常在 1.0–1.1 倍区间。如果你的使用场景包含:

  • 代码审查或生成(大量缩进和符号)
  • 结构化数据处理(JSON、CSV、XML 输入)
  • 多语言文本或混合文字
  • 带格式的长系统提示

……那么你更可能碰到 35–46% 的膨胀,而不是 10–15%。

怎么检查自己的暴露程度

最快的方法:取一批代表性的实际 API 输入,分别在 Opus 4.6 和 Opus 4.7 的分词器下跑一遍,对比 token 数量。Claude API 在响应对象里会返回 token 计数——连续记录一周,切换模型后做比对。比率超过 1.1 倍,说明分词器确实在影响你。

预算规划层面:以 30% 膨胀作为现有工作负载的保守基准。如果你的场景涉及代码或结构化数据的边界情况,预算应该为 40–45%。

2026 年选模型时这意味着什么

每 token 定价是通行的比较指标——但这个指标假设同一份输入在不同模型上产生相同的 token 数量。Claude Opus 4.7 的分词器改动打破了这个假设。跨平台对比成本时,你现在需要同时考虑分词器效率,而不只是标价。

模型输入 / 百万 tokens分词器膨胀(对比基准)实际成本系数
Claude Opus 4.8$5.00约 30–46%(新分词器)1.30–1.46 倍
GPT-5.5$5.00基准(tiktoken)1.0 倍
DeepSeek V4 Pro$0.435与 GPT 系列相近约 1.0 倍
Grok 4.3$1.25无公开数据约 1.0 倍

⚠️ 非 Claude 模型的分词器膨胀数据未经官方发布。GPT-5.5 等使用成熟分词器家族,2026 年无报告改动。Claude Opus 4.8 继承了 Opus 4.7 的分词器。

作者:yego | 数据来源:Anthropic Opus 4.7 发布说明、Claude 迁移指南(platform.claude.com)、Simon Willison(simonwillison.net,2026 年 4 月)、BetterStack Claude Opus 4.7 指南。最后更新:2026-06-23。

常见问题

Anthropic 给 Claude Opus 4.7 涨价了吗?

官方没有。标价维持在输入 $5/百万、输出 $25/百万,与 Opus 4.6 相同。但新分词器导致同样的文本会多产生 30–46% 的 token,对大多数工作负载来说,这实质上就是同等幅度的成本增加。

Claude Opus 4.7 处理同样的输入会多用多少 token?

Anthropic 自己的发布说明写明是 1.0–1.35 倍,取决于内容类型。迁移指南估算平均约多 30%。开发者在相同系统提示上的实测记录到了 1.46 倍。

Claude Opus 4.8 有同样的问题吗?

有。Claude Opus 4.8 继承了 Opus 4.7 引入的分词器,与 4.7 之前的版本相比,30–46% 的 token 膨胀同样适用于 Opus 4.8。

哪类内容受影响最大?

代码(缩进、符号)、结构化数据(JSON、CSV、XML)、多语言混合文本,以及格式复杂的系统提示,通常会触到 35–46% 膨胀范围的高端。纯英文连续散文一般在 10–20% 区间。

这对 Claude 和 GPT-5.5 的成本对比有什么影响?

Claude Opus 4.8 和 GPT-5.5 标价都是 $5/百万 token。但 GPT-5.5 使用 tiktoken,没有报告的膨胀;Claude Opus 4.8 的分词器会让同一份输入膨胀 30–46%。对于相同工作负载,Claude Opus 4.8 的实际等效成本约为 $6.50–$7.30/百万——明显高于标价。

相关链接

Claude Opus 4.8 实时价格GPT-5.5 vs Claude Opus 4.8 对比最便宜 LLM API全部 AI API 价格
← 返回博客