根据阿里云通义千问团队官宣,Qwen3系列开源了8个模型,其中包含2个MoE(混合专家)大模型和6个Dense(稠密)大模型。
本次Qwen3系列模型尤为值得关注的创新是该模型支持思考模式、非思考模式两种运行方式。
在思考模式下,模型会逐步推理,经过深思熟虑后给出最终答案。这种方法适合需要深入思考的复杂问题;在非思考模式中,模型会提供快速、近乎即时的响应,适用于对速度要求高于深度的简单问题。
换句话说,Qwen3打破了DeepSeek R1等思维链模型慢思考的单一模式,而是为用户赋予灵活选择的权利。这也是如今全球大模型市场发展的重要方向之一。