qwen
Qwen3-Omni
概览 简介 Qwen3-Omni 是一个原生端到端多语言全模态基础模型。它处理文本、图像、音频和视频,并以文本 … 阅读更多
Qwen3-Next-80B-A3B-Instruct
在过去的几个月里,我们观察到一个越来越清晰的趋势,即在追求更强大和代理型人工智能(AI)的过程中,总体参数和上 … 阅读更多
Apple Silicon 运行大模型 GGUF vs MLX 速度比较
GGUF(原名 GGML),是一个用于量化和推理大语言模型的格式。提供一种高效的模型存储格式,特别是支持量化模 … 阅读更多
Qwen3-4B-Instruct-2507 应用–快速AI翻译
近期发布的Qwen3-4B新模型性能大幅提升。在非推理(non-thinking)领域,Qwen3-4B-In … 阅读更多
Qwen3-4B-Thinking-2507 在数学推理题中的性能表现
近期发布的Qwen3-4B新模型性能大幅提升。在非推理(non-thinking)领域,Qwen3-4B-In … 阅读更多
Qwen3-4B超顶小模型登场
前两周,千问团队陆续更新了 Qwen3-235B-A22B 和 Qwen3-30B-A3B 的 Instruc … 阅读更多
MoE架构下的Qwen3-Coder-30B-A3B-Instruct到底有多快
Qwen3-Coder-30B-A3B-Instruct 又叫Qwen3-Coder-Flash,它具有以下特 … 阅读更多
Qwen2.5-VL
最新更新: 除了原始的公式外,我们还通过强化学习进一步增强了Qwen2.5-VL-32B在数学和解决问题方面的 … 阅读更多
Qwen2.5-VL 技术报告
Qwen2.5-VL,最新的视觉语言模型,通过动态分辨率处理、窗口注意力和原生视觉Transformer,提升 … 阅读更多