DeepSeek-V3.1 发布：迈向Agent时代的第一步（快速指南+核心解读）

大约 4 分钟

DeepSeek-V3.1 发布：迈向Agent时代的第一步（快速指南+核心解读）

8月21日，DeepSeek 正式发布 DeepSeek-V3.1。这一代在 混合推理（思维/非思维模式）、效率和 Agent工具链能力 上实现重大升级。更新已在官方App和网页端上线（新增"深度思考"开关）。API使用时，deepseek-chat 对应非思维模式，deepseek-reasoner 为思维模式，两者均支持 128K上下文窗口。此外，引入 严格Function Calling（Beta） 和 Anthropic API兼容性，更易与Claude Code等生态集成。

V3.1 核心变化

混合推理架构：一个模型，两种模式——自由切换"思维"与"非思维"状态。
效率提升：思维模式下平均减少 20%–50% token消耗，性能保持与R1-0528相当。
更强Agent能力：编码、终端任务和多步搜索显著改进。
开发者友好特性：128K上下文窗口，严格Function Calling（Beta），Anthropic API兼容性，API调用更流畅且可扩展。

Agent基准测试：编码与搜索能力大幅提升

公开测试显示在 编程Agent 和 搜索Agent 上均有显著进步：

SWE Verified（Agent模式）：V3.1 66.0 vs R1-0528 44.6
Terminal-bench（Terminus 1）：V3.1 31.3 vs R1-0528 5.7
BrowseComp（多步搜索）：V3.1-Think 30.0 vs R1-0528 8.9
HLE（专家级多领域挑战）：V3.1-Think 29.8 vs R1-0528 24.8

这意味着 工具调用更可靠，搜索驱动任务具备更深层推理能力。

推理效率：更短的链条，相同的精度

通过 思维链压缩训练，V3.1-Think 减少 20%–50% token输出，同时保持与R1-0528相当的结果。例如：

AIME 2026：88.4 vs 87.5
GPQA：80.1 vs 81
liveCodeBench：74.8 vs 73.3

实际应用中，这意味着 更低延迟和成本，同时维持推理准确性。

开发者必知的5件事

选择合适模型
快速轻量任务用 deepseek-chat；复杂推理用 deepseek-reasoner。两者均支持 128K上下文。
严格Function Calling（Beta）
设置 base_url=https://api.deepseek.com/beta，在schema中添加 strict: true。服务端将 强制校验schema，确保函数输出严格合规。
Anthropic API兼容性
配置 ANTHROPIC_BASE_URL=https://api.deepseek.com/anthropic，即可在 Claude Code 等基于Anthropic的SDK中直接调用DeepSeek模型。
开源与精度更新
- 发布模型：Base与精调权重（Hugging Face & ModelScope可获取）。
- 扩展预训练：在V3基础上新增840B token，增强长上下文和稳定性。
- 精度：采用UE8M0 FP8 Scale，更新tokenizer和对话模板（需迁移适配）。
定价与政策调整
自 2026年9月6日（北京时间） 起启用新计费方案，夜间优惠将取消。此前仍按现行价格执行。

15分钟快速上手

选择模式：高效场景用 deepseek-chat，深度推理用 deepseek-reasoner（128K支持）。
启用严格FC（可选）：定义带严格schema的工具以避免无效调用。
无缝集成：在Claude Code/Anthropic SDK中切换base URL即可快速接入。

常见问题

Q1: 如何切换思维与非思维模式？
App/网页端点击"深度思考"按钮；API调用时使用不同模型名称或模板。

Q2: 严格Function Calling的价值是什么？
确保 输出符合schema规范，减少格式错误——适合生产级Agent。

Q3: 能否与Anthropic/Claude Code集成？
可以。只需设置 ANTHROPIC_BASE_URL=https://api.deepseek.com/anthropic 和API Key。

Q4: V3.1开源版本有哪些新内容？
开源Base和精调模型，包含 840B token扩展训练，UE8M0 FP8精度，以及更新的tokenizer/模板。

Q5: 新定价何时生效？
2026年9月6日（北京时间）。夜间优惠将取消，但此前仍维持当前费率。