阿里通义正式发布国内首个通用推理模型

根据阿里云通义千问团队官宣,Qwen3系列开源了8个模型,其中包含2个MoE(混合专家)大模型和6个Dense(稠密)大模型。

本次Qwen3系列模型尤为值得关注的创新是该模型支持思考模式、非思考模式两种运行方式。

在思考模式下,模型会逐步推理,经过深思熟虑后给出最终答案。这种方法适合需要深入思考的复杂问题;在非思考模式中,模型会提供快速、近乎即时的响应,适用于对速度要求高于深度的简单问题。

换句话说,Qwen3打破了DeepSeek R1等思维链模型慢思考的单一模式,而是为用户赋予灵活选择的权利。这也是如今全球大模型市场发展的重要方向之一。

上一篇:

下一篇:

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

联系我们

客服邮箱: kefu@yadiannaai.com

投稿邮箱:tougao@yadiannaai.com

合作邮箱:hezuo@yadiannaai.com

关注微信