DeepSeek-V3.1-Terminus - 诺德美地科技

介绍

此次更新在保持模型原有能力的同时，解决了用户报告的一些问题，包括：

语言一致性：减少中英文混杂文本和偶尔出现的异常字符；
代理能力：进一步优化代码代理和搜索代理的性能。

基准	DeepSeek-V3.1	DeepSeek-V3.1-Terminus
无工具使用推理模式
MMLU-Pro	84.8	85.0
GPQA-Diamond	80.1	80.7
人类最后的考试	15.9	21.7
LiveCodeBench	74.8	74.9
Codeforces	2091	2046
Aider-Polyglot	76.3	76.1
代理工具使用
BrowseComp	30.0	38.5
BrowseComp-zh	49.2	45.0
SimpleQA	93.4	96.8
SWE Verified	66.0	68.4
SWE-bench 多语言	54.5	57.8
Terminal-bench	31.3	36.7

搜索代理的模板和工具集已更新，详见 assets/search_tool_trajectory.html。

如何本地运行

DeepSeek-V3.1-Terminus 的模型结构与 DeepSeek-V3 相同。请访问 DeepSeek-V3 仓库以获取更多关于本地运行此模型的信息。

对于除搜索代理之外的模型聊天模板，请参考 DeepSeek-V3.1 仓库。

我们还在 inference 文件夹中提供了一个更新后的推理演示代码，以帮助社区开始运行我们的模型并了解模型架构的细节。

注意：在当前模型检查点中，self_attn.o_proj 参数不符合 UE8M0 FP8 格式的数据格式。这是一个已知问题，将在未来的模型发布中得到修正。

许可证

此仓库和模型权重均采用 MIT 许可证。

引用

@misc{deepseekai2024deepseekv3technicalreport,
      title={DeepSeek-V3 Technical Report}, 
      author={DeepSeek-AI},
      year={2024},
      eprint={2412.19437},
      archivePrefix={arXiv},
      primaryClass={cs.CL},
      url={https://arxiv.org/abs/2412.19437}, 
}

联系方式

如果您有任何问题，请提出问题或通过 service@deepseek.com 联系我们。

原创文章，转载请注明： 转载自诺德美地科技

本文链接地址: DeepSeek-V3.1-Terminus

介绍

如何本地运行

许可证

引用

联系方式

发表评论 取消回复

发表评论取消回复