诺德美地科技 - UsionMedia

Qwen3-4B-Thinking-2507 在数学推理题中的性能表现

2025年8月13日2025年8月9日作者 illuspas

近期发布的Qwen3-4B新模型性能大幅提升。在非推理（non-thinking）领域，Qwen3-4B-In … 阅读更多

2025年8月8日作者 illuspas

前两周，千问团队陆续更新了 Qwen3-235B-A22B 和 Qwen3-30B-A3B 的 Instruc … 阅读更多

2025年8月15日2025年8月8日作者 illuspas

Qwen3-Coder-30B-A3B-Instruct 又叫Qwen3-Coder-Flash，它具有以下特 … 阅读更多

2025年8月8日作者 illuspas

最新更新：除了原始的公式外，我们还通过强化学习进一步增强了Qwen2.5-VL-32B在数学和解决问题方面的 … 阅读更多

2025年8月8日作者 illuspas

Qwen2.5-VL，最新的视觉语言模型，通过动态分辨率处理、窗口注意力和原生视觉Transformer，提升 … 阅读更多

2025年8月8日作者 illuspas

模型介绍混元是腾讯开源的高效大型语言模型系列，旨在适应各种计算环境的多样化部署。从边缘设备到高并发生产系统， … 阅读更多

2025年8月8日2025年8月8日作者 illuspas

特性 DeepSeek-V3-0324 在多个关键方面展示了相较于其前代产品 DeepSeek-V3 的显著改 … 阅读更多

2025年8月8日2025年8月8日作者 illuspas

本文介绍了DeepSeek-V3语言模型，它是一种强大的混合专家（MoE）模型，总参数量为671B，每个标记激 … 阅读更多

2025年8月8日作者 illuspas

1. 介绍 DeepSeek R1 模型经历了一次小版本升级，当前版本为 DeepSeek-R1-0528。在 … 阅读更多

2025年8月8日作者 illuspas

模型介绍 GLM-4.5 系列模型是专为智能体设计的基础模型。GLM-4.5拥有 3550 … 阅读更多