DeepSeek-V3.1-Terminus

介绍

此次更新在保持模型原有能力的同时,解决了用户报告的一些问题,包括:

  • 语言一致性:减少中英文混杂文本和偶尔出现的异常字符;
  • 代理能力:进一步优化代码代理和搜索代理的性能。
基准DeepSeek-V3.1DeepSeek-V3.1-Terminus
无工具使用推理模式
MMLU-Pro84.885.0
GPQA-Diamond80.180.7
人类最后的考试15.921.7
LiveCodeBench74.874.9
Codeforces20912046
Aider-Polyglot76.376.1
代理工具使用
BrowseComp30.038.5
BrowseComp-zh49.245.0
SimpleQA93.496.8
SWE Verified66.068.4
SWE-bench 多语言54.557.8
Terminal-bench31.336.7

搜索代理的模板和工具集已更新,详见 assets/search_tool_trajectory.html

如何本地运行

DeepSeek-V3.1-Terminus 的模型结构与 DeepSeek-V3 相同。请访问 DeepSeek-V3 仓库以获取更多关于本地运行此模型的信息。

对于除搜索代理之外的模型聊天模板,请参考 DeepSeek-V3.1 仓库。

我们还在 inference 文件夹中提供了一个更新后的推理演示代码,以帮助社区开始运行我们的模型并了解模型架构的细节。

注意:在当前模型检查点中,self_attn.o_proj 参数不符合 UE8M0 FP8 格式的数据格式。这是一个已知问题,将在未来的模型发布中得到修正。

许可证

此仓库和模型权重均采用 MIT 许可证

引用

@misc{deepseekai2024deepseekv3technicalreport,
      title={DeepSeek-V3 Technical Report}, 
      author={DeepSeek-AI},
      year={2024},
      eprint={2412.19437},
      archivePrefix={arXiv},
      primaryClass={cs.CL},
      url={https://arxiv.org/abs/2412.19437}, 
}

联系方式

如果您有任何问题,请提出问题或通过 service@deepseek.com 联系我们。

原创文章,转载请注明: 转载自诺德美地科技

本文链接地址: DeepSeek-V3.1-Terminus

发表评论