qwen
-
Qwen3 Embedding— 阿里通义开源的文本嵌入模型系列
Qwen3 表征是什么 qwen3 表征是依托于 qwen3 主体模型研发的文本表征、检索与排序专用模型。它继承了 qwen3 的核心架构,比如 grouped query att…
-
Qwen3 Reranker— 阿里通义开源的文本重排序模型
Qwen3 Reranker是什么 qwen3 reranker是由阿里巴巴通义千问团队推出的文本重排序模型,隶属于qwen3模型系列。此模型采用了单塔交叉编码器结构,能够接受文本…

-
QwenLong-L1-32B— 阿里Qwen-Doc开源的长文本推理模型
QwenLong-L1-32B是什么? qwenlong-l1-32b 是由阿里巴巴集团 qwen-doc 团队开源的一款专注于长文本推理的大规模语言模型。该模型采用了渐进式上下文…
-
BAGEL— 字节跳动开源的多模态基础模型
BAGEL是什么 bagel是字节跳动开源的多模态基础模型,拥有140亿参数,其中70亿为活跃参数。采用混合变换器专家架构(mot),通过两个独立编码器分别捕捉图像的像素级和语义级…
-
华科北邮联合推出PR1:强化学习助力多模态LLM视觉感知超越YOLOv3
华中科技大学、北京邮电大学等多所高校的研究团队最近合作推出了Perception-R1(PR1)多模态大语言模型,这一模型在COCO2017验证集上首次突破了30AP,成为首个在纯…