介绍
此次更新在保持模型原有能力的同时,解决了用户报告的一些问题,包括:
- 语言一致性:减少中英文混杂文本和偶尔出现的异常字符;
- 代理能力:进一步优化代码代理和搜索代理的性能。
基准 | DeepSeek-V3.1 | DeepSeek-V3.1-Terminus |
---|---|---|
无工具使用推理模式 | ||
MMLU-Pro | 84.8 | 85.0 |
GPQA-Diamond | 80.1 | 80.7 |
人类最后的考试 | 15.9 | 21.7 |
LiveCodeBench | 74.8 | 74.9 |
Codeforces | 2091 | 2046 |
Aider-Polyglot | 76.3 | 76.1 |
代理工具使用 | ||
BrowseComp | 30.0 | 38.5 |
BrowseComp-zh | 49.2 | 45.0 |
SimpleQA | 93.4 | 96.8 |
SWE Verified | 66.0 | 68.4 |
SWE-bench 多语言 | 54.5 | 57.8 |
Terminal-bench | 31.3 | 36.7 |
搜索代理的模板和工具集已更新,详见 assets/search_tool_trajectory.html
。
如何本地运行
DeepSeek-V3.1-Terminus 的模型结构与 DeepSeek-V3 相同。请访问 DeepSeek-V3 仓库以获取更多关于本地运行此模型的信息。
对于除搜索代理之外的模型聊天模板,请参考 DeepSeek-V3.1 仓库。
我们还在 inference
文件夹中提供了一个更新后的推理演示代码,以帮助社区开始运行我们的模型并了解模型架构的细节。
注意:在当前模型检查点中,self_attn.o_proj
参数不符合 UE8M0 FP8 格式的数据格式。这是一个已知问题,将在未来的模型发布中得到修正。
许可证
此仓库和模型权重均采用 MIT 许可证。
引用
@misc{deepseekai2024deepseekv3technicalreport,
title={DeepSeek-V3 Technical Report},
author={DeepSeek-AI},
year={2024},
eprint={2412.19437},
archivePrefix={arXiv},
primaryClass={cs.CL},
url={https://arxiv.org/abs/2412.19437},
}
联系方式
如果您有任何问题,请提出问题或通过 service@deepseek.com 联系我们。
原创文章,转载请注明: 转载自诺德美地科技
本文链接地址: DeepSeek-V3.1-Terminus