测试 - 诺德美地科技

MI50 使用llama.cpp的vulkan与ROCm后端的性能比较

2025年9月24日2025年9月24日作者 illuspas

版本号： llama: b6550ROCm: 6.3.4 Vulkan版本来自github官方下载，ROCm版 … 阅读更多

Apple Silicon 运行大模型 GGUF vs MLX 速度比较

2025年8月15日作者 illuspas

GGUF（原名 GGML），是一个用于量化和推理大语言模型的格式。提供一种高效的模型存储格式，特别是支持量化模 … 阅读更多

Qwen3-4B-Thinking-2507 在数学推理题中的性能表现

2025年8月13日2025年8月9日作者 illuspas

近期发布的Qwen3-4B新模型性能大幅提升。在非推理（non-thinking）领域，Qwen3-4B-In … 阅读更多

MoE架构下的Qwen3-Coder-30B-A3B-Instruct到底有多快

2025年8月15日2025年8月8日作者 illuspas

Qwen3-Coder-30B-A3B-Instruct 又叫Qwen3-Coder-Flash，它具有以下特 … 阅读更多