Qwen3-Embedding - 诺德美地科技

亮点

Qwen3 Embedding 模型系列是 Qwen 家族的最新专有模型，专门设计用于文本嵌入和排序任务。基于 Qwen3 系列的密集基础模型，它提供了各种大小（0.6B、4B 和 8B）的全面文本嵌入和重排序模型。该系列继承了其基础模型卓越的多语言能力、长文本理解和推理技能。Qwen3 Embedding 系列在多个文本嵌入和排序任务中取得了显著进步，包括文本检索、代码检索、文本分类、文本聚类和双语文本挖掘。

卓越的多功能性：该嵌入模型在广泛的下游应用评估中达到了最先进的性能。8B 大小的嵌入模型在 MTEB 多语言排行榜上排名第 1（截至 2025 年 6 月 5 日，得分为 70.58），而重排序模型在各种文本检索场景中表现出色。

全面的灵活性：Qwen3 Embedding 系列提供了从 0.6B 到 8B 的全尺寸范围的嵌入和重排序模型，适用于重视效率和效果的各种使用场景。开发人员可以无缝地组合这两个模块。此外，嵌入模型允许在所有维度上灵活定义向量，并且嵌入和重排序模型都支持用户定义的指令，以增强特定任务、语言或场景的性能。

多语言能力：得益于 Qwen3 模型的多语言能力，Qwen3 Embedding 系列支持超过 100 种语言。这包括多种编程语言，并提供了强大的多语言、跨语言和代码检索能力。

模型概述

Qwen3-Embedding-0.6B 具有以下特点：

模型类型：文本嵌入
支持的语言：100+ 种语言
参数数量：0.6B
上下文长度：32k
嵌入维度：最高 1024，支持用户自定义输出维度，范围从 32 到 1024

有关更多详细信息，包括基准评估、硬件要求和推理性能，请参阅我们的博客、GitHub。

Qwen3 Embedding 系列模型列表

模型类型	模型	大小	层数	序列长度	嵌入维度	MRL 支持	指令感知
文本嵌入	Qwen3-Embedding-0.6B	0.6B	28	32K	1024	是	是
文本嵌入	Qwen3-Embedding-4B	4B	36	32K	2560	是	是
文本嵌入	Qwen3-Embedding-8B	8B	36	32K	4096	是	是
文本重排序	Qwen3-Reranker-0.6B	0.6B	28	32K	–	–	是
文本重排序	Qwen3-Reranker-4B	4B	36	32K	–	–	是
文本重排序	Qwen3-Reranker-8B	8B	36	32K	–	–	是

注意:

MRL 支持 表示嵌入模型是否支持自定义最终嵌入的维度。

指令感知 标注了嵌入或重排序模型是否支持根据不同任务定制输入指令。

我们的评估表明，对于大多数下游任务，使用指令（instruct）通常比不使用它们能提高1%到5%。因此，我们建议开发者根据其任务和场景创建特定的指令。在多语言环境中，我们也建议用户用英语编写指令，因为模型训练过程中使用的大多数指令最初是用英语编写的。

原创文章，转载请注明： 转载自诺德美地科技

本文链接地址: Qwen3-Embedding

亮点

模型概述

Qwen3 Embedding 系列模型列表

发表评论 取消回复

发表评论取消回复