跳至内容
诺德美地科技
  • 首页
  • 模型
  • 文档
  • 测试
  • 留言

DeepSeek-V3.1

2025年8月22日 作者 illuspas

介绍 DeepSeek-V3.1 是一个支持思考模式和非思考模式的混合模型。与之前的版本相比,这次升级在多个方 … 阅读更多

分类 DeepSeek、 模型 标签 deepseek 发表评论

Seed-OSS-36B-Instruct

2025年8月22日 作者 illuspas

简介 Seed-OSS 是由字节跳动种子团队开发的一系列开源大型语言模型,旨在提供强大的长上下文、推理、代理和 … 阅读更多

分类 Seed、 模型 发表评论

Apple Silicon 运行大模型 GGUF vs MLX 速度比较

2025年8月15日 作者 illuspas

GGUF(原名 GGML),是一个用于量化和推理大语言模型的格式。提供一种高效的模型存储格式,特别是支持量化模 … 阅读更多

分类 测试 标签 qwen 发表评论

Qwen3-4B-Instruct-2507 应用–快速AI翻译

2025年8月14日2025年8月13日 作者 illuspas

近期发布的Qwen3-4B新模型性能大幅提升。在非推理(non-thinking)领域,Qwen3-4B-In … 阅读更多

分类 文档 标签 qwen 发表评论

Qwen3-4B-Thinking-2507 在数学推理题中的性能表现

2025年8月13日2025年8月9日 作者 illuspas

近期发布的Qwen3-4B新模型性能大幅提升。在非推理(non-thinking)领域,Qwen3-4B-In … 阅读更多

分类 测试 标签 qwen 发表评论

Qwen3-4B超顶小模型登场

2025年8月8日 作者 illuspas

前两周,千问团队陆续更新了 Qwen3-235B-A22B 和 Qwen3-30B-A3B 的 Instruc … 阅读更多

分类 Qwen、 模型 标签 qwen 发表评论

MoE架构下的Qwen3-Coder-30B-A3B-Instruct到底有多快

2025年8月15日2025年8月8日 作者 illuspas

Qwen3-Coder-30B-A3B-Instruct 又叫Qwen3-Coder-Flash,它具有以下特 … 阅读更多

分类 测试 标签 qwen 发表评论

Qwen2.5-VL

2025年8月8日 作者 illuspas

最新更新: 除了原始的公式外,我们还通过强化学习进一步增强了Qwen2.5-VL-32B在数学和解决问题方面的 … 阅读更多

分类 Qwen、 模型 标签 qwen 发表评论

Qwen2.5-VL 技术报告

2025年8月8日 作者 illuspas

Qwen2.5-VL,最新的视觉语言模型,通过动态分辨率处理、窗口注意力和原生视觉Transformer,提升 … 阅读更多

分类 文档 标签 qwen 发表评论

Hunyuan-1.8B-Instruct

2025年8月8日 作者 illuspas

模型介绍 混元是腾讯开源的高效大型语言模型系列,旨在适应各种计算环境的多样化部署。从边缘设备到高并发生产系统, … 阅读更多

分类 hunyuan、 模型 发表评论
较早文章
页面1 页面2 页面3 下一页 →

近期文章

  • DeepSeek-V3.1
  • Seed-OSS-36B-Instruct
  • Apple Silicon 运行大模型 GGUF vs MLX 速度比较
  • Qwen3-4B-Instruct-2507 应用–快速AI翻译
  • Qwen3-4B-Thinking-2507 在数学推理题中的性能表现

近期评论

您尚未收到任何评论。

蜀ICP备15005438号-3

© 2025 诺德美地科技 • Built with GeneratePress