Qwen3-Embedding

亮点

Qwen3 Embedding 模型系列是 Qwen 家族的最新专有模型,专门设计用于文本嵌入和排序任务。基于 Qwen3 系列的密集基础模型,它提供了各种大小(0.6B、4B 和 8B)的全面文本嵌入和重排序模型。该系列继承了其基础模型卓越的多语言能力、长文本理解和推理技能。Qwen3 Embedding 系列在多个文本嵌入和排序任务中取得了显著进步,包括文本检索、代码检索、文本分类、文本聚类和双语文本挖掘。

卓越的多功能性:该嵌入模型在广泛的下游应用评估中达到了最先进的性能。8B 大小的嵌入模型在 MTEB 多语言排行榜上排名第 1(截至 2025 年 6 月 5 日,得分为 70.58),而重排序模型在各种文本检索场景中表现出色。

全面的灵活性:Qwen3 Embedding 系列提供了从 0.6B 到 8B 的全尺寸范围的嵌入和重排序模型,适用于重视效率和效果的各种使用场景。开发人员可以无缝地组合这两个模块。此外,嵌入模型允许在所有维度上灵活定义向量,并且嵌入和重排序模型都支持用户定义的指令,以增强特定任务、语言或场景的性能。

多语言能力:得益于 Qwen3 模型的多语言能力,Qwen3 Embedding 系列支持超过 100 种语言。这包括多种编程语言,并提供了强大的多语言、跨语言和代码检索能力。

模型概述

Qwen3-Embedding-0.6B 具有以下特点:

  • 模型类型:文本嵌入
  • 支持的语言:100+ 种语言
  • 参数数量:0.6B
  • 上下文长度:32k
  • 嵌入维度:最高 1024,支持用户自定义输出维度,范围从 32 到 1024

有关更多详细信息,包括基准评估、硬件要求和推理性能,请参阅我们的 博客GitHub

Qwen3 Embedding 系列模型列表

模型类型模型大小层数序列长度嵌入维度MRL 支持指令感知
文本嵌入Qwen3-Embedding-0.6B0.6B2832K1024
文本嵌入Qwen3-Embedding-4B4B3632K2560
文本嵌入Qwen3-Embedding-8B8B3632K4096
文本重排序Qwen3-Reranker-0.6B0.6B2832K
文本重排序Qwen3-Reranker-4B4B3632K
文本重排序Qwen3-Reranker-8B8B3632K

注意:

  • MRL 支持 表示嵌入模型是否支持自定义最终嵌入的维度。
  • 指令感知 标注了嵌入或重排序模型是否支持根据不同任务定制输入指令。
  • 我们的评估表明,对于大多数下游任务,使用指令(instruct)通常比不使用它们能提高1%到5%。因此,我们建议开发者根据其任务和场景创建特定的指令。在多语言环境中,我们也建议用户用英语编写指令,因为模型训练过程中使用的大多数指令最初是用英语编写的。

原创文章,转载请注明: 转载自诺德美地科技

本文链接地址: Qwen3-Embedding

发表评论