亮点
Qwen3 嵌入模型系列是 Qwen 家族的最新专有模型,专门设计用于文本嵌入和排名任务。基于 Qwen3 系列的密集基础模型,它提供了各种大小(0.6B、4B 和 8B)的全面文本嵌入和重新排名模型。该系列继承了其基础模型出色的多语言能力、长文本理解和推理技能。Qwen3 嵌入系列在多个文本嵌入和排名任务中代表了显著的进步,包括文本检索、代码检索、文本分类、文本聚类和双语文本挖掘。
卓越的多功能性:嵌入模型在广泛的下游应用评估中取得了最先进的性能。8B 大小的嵌入模型在 MTEB 多语言排行榜上排名第一(截至 2025 年 6 月 5 日,得分为 70.58),而重新排名模型在各种文本检索场景中表现出色。
全面的灵活性:Qwen3 嵌入系列提供了从 0.6B 到 8B 的全尺寸范围的嵌入和重新排名模型,满足重视效率和效果的各种使用场景。开发人员可以无缝结合这两个模块。此外,嵌入模型允许在所有维度上灵活定义向量,并且嵌入和重新排名模型都支持用户定义的指令,以增强特定任务、语言或场景的性能。
多语言能力:得益于 Qwen3 模型的多语言能力,Qwen3 嵌入系列支持 100 多种语言。这包括多种编程语言,并提供强大的多语言、跨语言和代码检索能力。
模型概述
Qwen3-Reranker-8B 具有以下特点:
- 模型类型:文本重新排名
- 支持的语言:100 多种语言
- 参数数量:8B
- 上下文长度:32k
更多详细信息,包括基准评估、硬件要求和推理性能,请参阅我们的 博客 和 GitHub。
Qwen3 嵌入系列模型列表
模型类型 | 模型 | 大小 | 层数 | 序列长度 | 嵌入维度 | MRL 支持 | 指令感知 |
---|---|---|---|---|---|---|---|
文本嵌入 | Qwen3-Embedding-0.6B | 0.6B | 28 | 32K | 1024 | 是 | 是 |
文本嵌入 | Qwen3-Embedding-4B | 4B | 36 | 32K | 2560 | 是 | 是 |
文本嵌入 | Qwen3-Embedding-8B | 8B | 36 | 32K | 4096 | 是 | 是 |
文本重排序 | Qwen3-Reranker-0.6B | 0.6B | 28 | 32K | – | – | 是 |
文本重排序 | Qwen3-Reranker-4B | 4B | 36 | 32K | – | – | 是 |
文本重排序 | Qwen3-Reranker-8B | 8B | 36 | 32K | – | – | 是 |
注意:
MRL 支持
表示嵌入模型是否支持自定义最终嵌入的维度。指令感知
表示嵌入或重排序模型是否支持根据不同的任务定制输入指令。- 我们的评估表明,对于大多数下游任务,使用指令(instruct)通常比不使用指令提高 1% 到 5% 的性能。因此,我们建议开发者为他们的任务和场景创建量身定制的指令。在多语言环境中,我们也建议用户用英语编写他们的指令,因为在模型训练过程中使用的大多数指令都是用英语编写的。
原创文章,转载请注明: 转载自诺德美地科技
本文链接地址: Qwen3-Reranker