功能对比
| 项目 | 数值 | 规划备注 |
|---|---|---|
| Context window | 200,000 tokens | 输入和工作上下文需要在回复前放入窗口。 |
| 输入价格 | $3 / 1M tokens | 适用于 prompt、文件、消息和工具上下文。 |
| 输出价格 | $15 / 1M tokens | 适用于模型生成内容。 |
| 安全余量 | 10% 到 20% | 给格式、工具和 completion 留空间。 |
| 最佳检查方式 | 官方 token counting API | 发送结构化 prompt 前先 count_tokens。 |
Context Window 计算器
规划长 prompt、仓库摘要、文档批处理或工具密集请求时,使用这个公式。
usable_context = 200000 - expected_output_tokens - safety_reserve remaining_input = usable_context - system_tokens - message_tokens - tool_tokens
成本计算器
Claude 3.5 Sonnet API 成本要把输入和输出 token 分开计算。
input_cost = input_tokens / 1000000 * 3
output_cost = output_tokens / 1000000 * 15
total_cost = input_cost + output_cost
Example:
input_tokens = 80000
output_tokens = 4000
total_cost = 80000 / 1000000 * 3 + 4000 / 1000000 * 15
= $0.30实用规划表
这些粗略区间能帮助决定是直接粘贴、总结,还是用检索。
- 20K tokens 以下:通常适合直接 prompt 并保留完整回复空间。
- 20K 到 100K tokens:明确保留输出空间,避免无用日志。
- 100K 到 180K tokens:认真规划余量,并在发送前计数。
- 180K tokens 以上:先总结、切块、检索或减少工具输出。
官方参考
Anthropic 的 Claude 3.5 Sonnet 发布文章列出 200K context window 和发布价格;token counting 文档说明如何在发送前计算结构化消息 tokens。
常见问题
Claude 3.5 Sonnet context window 是多少?
Claude 3.5 Sonnet 发布时 context window 是 200,000 tokens。
输出会占用 context window 吗?
规划时应该给预期回复留空间。如果输入填满窗口,模型就没有足够空间回答。
Claude 3.5 Sonnet 每 token 多少钱?
发布价格是输入 $3 / 1M tokens、输出 $15 / 1M tokens。
如何准确计算 Claude tokens?
对结构化 API 消息使用 Anthropic token counting endpoint。字符或单词估算只能粗略参考。