价格没变，账单涨了 35%：Claude Opus 4.7 分词器改动的真相

发布于 2026-06-23·5 min read

发生了什么

2026 年初，Anthropic 发布 Claude Opus 4.7，标价与 Opus 4.6 相同：输入 $5/百万 tokens，输出 $25/百万 tokens。发布标题没有提的一件事：底层分词器换了，同样的文字现在比以前多消耗 30–46% 的 tokens。

Anthropic 自己的发布说明写得很清楚：

"Opus 4.7 使用了新的分词器，改进了模型处理文本的方式。代价是：同样的输入会多产生 1.0–1.35 倍的 token，具体取决于内容类型。"

迁移指南补充道："与 Opus 4.7 之前的模型相比，同样的内容会多出约 30% 的 token。" 接着建议开发者减小 max_tokens 或压缩输出——换句话说就是：不改代码的话，账单会涨。

具体数字

指标	数值	来源
官方 token 膨胀范围	1.0–1.35 倍	Anthropic 发布说明
迁移指南估算	约多 30%	Claude 迁移文档
开发者工具实测	1.46 倍（相同系统提示）	Simon Willison，2026 年 4 月
实际成本增幅	30–46%	由上述数据推算
每百万 token 定价（不变）	输入 $5.00 / 输出 $25.00	Anthropic 官方

算法很简单：如果你每月在 Claude Opus 4.6 上花 100 美元，切换到 Opus 4.7 后，同样的工作量不改任何代码，账单会变成 130–146 美元。

为什么这比直接涨价更危险

直接涨价是可见的——你能在定价页面看到，提前规划预算，决定是否留下。分词器变动是隐形的——定价页面还是写着 $5/百万，监控面板显示的单价没变，但每次请求消耗的 token 数量悄悄涨上去了。

唯一的察觉方式是对同一份输入在不同版本之间做 token 数量对比。大多数团队没有自动做这个，所以很多 Claude Opus 用户在没察觉的情况下默默吸收了 30–46% 的成本增幅。

哪些内容类型受影响最大

Anthropic 给出的 1.0–1.35 倍范围不是均匀分布的。根据现有数据，包含大量空白符、代码格式或混合语言的内容更容易触到膨胀范围的高端。纯英文连续散文通常在 1.0–1.1 倍区间。如果你的使用场景包含：

代码审查或生成（大量缩进和符号）
结构化数据处理（JSON、CSV、XML 输入）
多语言文本或混合文字
带格式的长系统提示

……那么你更可能碰到 35–46% 的膨胀，而不是 10–15%。

怎么检查自己的暴露程度

最快的方法：取一批代表性的实际 API 输入，分别在 Opus 4.6 和 Opus 4.7 的分词器下跑一遍，对比 token 数量。Claude API 在响应对象里会返回 token 计数——连续记录一周，切换模型后做比对。比率超过 1.1 倍，说明分词器确实在影响你。

预算规划层面：以 30% 膨胀作为现有工作负载的保守基准。如果你的场景涉及代码或结构化数据的边界情况，预算应该为 40–45%。

2026 年选模型时这意味着什么

每 token 定价是通行的比较指标——但这个指标假设同一份输入在不同模型上产生相同的 token 数量。Claude Opus 4.7 的分词器改动打破了这个假设。跨平台对比成本时，你现在需要同时考虑分词器效率，而不只是标价。

模型	输入 / 百万 tokens	分词器膨胀（对比基准）	实际成本系数
Claude Opus 4.8	$5.00	约 30–46%（新分词器）	1.30–1.46 倍
GPT-5.5	$5.00	基准（tiktoken）	1.0 倍
DeepSeek V4 Pro	$0.435	与 GPT 系列相近	约 1.0 倍
Grok 4.3	$1.25	无公开数据	约 1.0 倍

⚠️ 非 Claude 模型的分词器膨胀数据未经官方发布。GPT-5.5 等使用成熟分词器家族，2026 年无报告改动。Claude Opus 4.8 继承了 Opus 4.7 的分词器。

作者：yego | 数据来源：Anthropic Opus 4.7 发布说明、Claude 迁移指南（platform.claude.com）、Simon Willison（simonwillison.net，2026 年 4 月）、BetterStack Claude Opus 4.7 指南。最后更新：2026-06-23。

常见问题

Anthropic 给 Claude Opus 4.7 涨价了吗？

官方没有。标价维持在输入 $5/百万、输出 $25/百万，与 Opus 4.6 相同。但新分词器导致同样的文本会多产生 30–46% 的 token，对大多数工作负载来说，这实质上就是同等幅度的成本增加。

Claude Opus 4.7 处理同样的输入会多用多少 token？

Anthropic 自己的发布说明写明是 1.0–1.35 倍，取决于内容类型。迁移指南估算平均约多 30%。开发者在相同系统提示上的实测记录到了 1.46 倍。

Claude Opus 4.8 有同样的问题吗？

有。Claude Opus 4.8 继承了 Opus 4.7 引入的分词器，与 4.7 之前的版本相比，30–46% 的 token 膨胀同样适用于 Opus 4.8。

哪类内容受影响最大？

代码（缩进、符号）、结构化数据（JSON、CSV、XML）、多语言混合文本，以及格式复杂的系统提示，通常会触到 35–46% 膨胀范围的高端。纯英文连续散文一般在 10–20% 区间。

这对 Claude 和 GPT-5.5 的成本对比有什么影响？

Claude Opus 4.8 和 GPT-5.5 标价都是 $5/百万 token。但 GPT-5.5 使用 tiktoken，没有报告的膨胀；Claude Opus 4.8 的分词器会让同一份输入膨胀 30–46%。对于相同工作负载，Claude Opus 4.8 的实际等效成本约为 $6.50–$7.30/百万——明显高于标价。