DeepSeek-V3.1 发布:迈向Agent时代的第一步(快速指南+核心解读)
DeepSeek-V3.1 发布:迈向Agent时代的第一步(快速指南+核心解读)
8月21日,DeepSeek 正式发布 DeepSeek-V3.1。这一代在 混合推理(思维/非思维模式)、效率 和 Agent工具链能力 上实现重大升级。更新已在官方App和网页端上线(新增"深度思考"开关)。API使用时,deepseek-chat
对应非思维模式,deepseek-reasoner
为思维模式,两者均支持 128K上下文窗口。此外,引入 严格Function Calling(Beta) 和 Anthropic API兼容性,更易与Claude Code等生态集成。
V3.1 核心变化
- 混合推理架构:一个模型,两种模式——自由切换"思维"与"非思维"状态。
- 效率提升:思维模式下平均减少 20%–50% token消耗,性能保持与R1-0528相当。
- 更强Agent能力:编码、终端任务和多步搜索显著改进。
- 开发者友好特性:128K上下文窗口,严格Function Calling(Beta),Anthropic API兼容性,API调用更流畅且可扩展。
Agent基准测试:编码与搜索能力大幅提升
公开测试显示在 编程Agent 和 搜索Agent 上均有显著进步:
- SWE Verified(Agent模式):V3.1 66.0 vs R1-0528 44.6
- Terminal-bench(Terminus 1):V3.1 31.3 vs R1-0528 5.7
- BrowseComp(多步搜索):V3.1-Think 30.0 vs R1-0528 8.9
- HLE(专家级多领域挑战):V3.1-Think 29.8 vs R1-0528 24.8
这意味着 工具调用更可靠,搜索驱动任务具备更深层推理能力。
推理效率:更短的链条,相同的精度
通过 思维链压缩训练,V3.1-Think 减少 20%–50% token输出,同时保持与R1-0528相当的结果。例如:
- AIME 2025:88.4 vs 87.5
- GPQA:80.1 vs 81
- liveCodeBench:74.8 vs 73.3
实际应用中,这意味着 更低延迟和成本,同时维持推理准确性。
开发者必知的5件事
选择合适模型
快速轻量任务用deepseek-chat
;复杂推理用deepseek-reasoner
。两者均支持 128K上下文。严格Function Calling(Beta)
设置base_url=https://api.deepseek.com/beta
,在schema中添加strict: true
。服务端将 强制校验schema,确保函数输出严格合规。Anthropic API兼容性
配置ANTHROPIC_BASE_URL=https://api.deepseek.com/anthropic
,即可在 Claude Code 等基于Anthropic的SDK中直接调用DeepSeek模型。开源与精度更新
- 发布模型:Base与精调权重(Hugging Face & ModelScope可获取)。
- 扩展预训练:在V3基础上新增840B token,增强长上下文和稳定性。
- 精度:采用UE8M0 FP8 Scale,更新tokenizer和对话模板(需迁移适配)。
定价与政策调整
自 2025年9月6日(北京时间) 起启用新计费方案,夜间优惠将取消。此前仍按现行价格执行。
15分钟快速上手
- 选择模式:高效场景用
deepseek-chat
,深度推理用deepseek-reasoner
(128K支持)。 - 启用严格FC(可选):定义带严格schema的工具以避免无效调用。
- 无缝集成:在Claude Code/Anthropic SDK中切换base URL即可快速接入。
推荐使用场景
- 检索型Agent:搜索→过滤→合成的流程化任务。
- DevOps & 编程助手:代码修复、补丁生成、脚本编写、命令行操作。
- 长对话成本控制:128K + 压缩推理 = 深度上下文与更低开销兼得。
常见问题
Q1: 如何切换思维与非思维模式?
App/网页端点击"深度思考"按钮;API调用时使用不同模型名称或模板。
Q2: 严格Function Calling的价值是什么?
确保 输出符合schema规范,减少格式错误——适合生产级Agent。
Q3: 能否与Anthropic/Claude Code集成?
可以。只需设置 ANTHROPIC_BASE_URL=https://api.deepseek.com/anthropic
和API Key。
Q4: V3.1开源版本有哪些新内容?
开源Base和精调模型,包含 840B token扩展训练,UE8M0 FP8精度,以及更新的tokenizer/模板。
Q5: 新定价何时生效?
2025年9月6日(北京时间)。夜间优惠将取消,但此前仍维持当前费率。