阿里发布最新开源模型成本仅为DeepSeek1/3

界面新闻 2025-04-28 22:42

　　阿里巴巴4月29日凌晨发布开源新一代通义千问模型Qwen3（简称千问3），参数量仅为DeepSeek-R1的1／3，成本大幅下降，同时是国内首个“混合推理模型”，将“快思考”与“慢思考”集成进同一个模型，大大节省算力消耗。据官方说法，Qwen3的旗舰版本 Qwen3-235B-A22B，在代码、数学、通用能力等基准测试中，达到了与 DeepSeek-R1、o1、o3-mini、Grok-3 和 Gemini-2.5-Pro同一层级水准。

　　据了解，Qwen3系列模型依旧采用宽松的Apache2.0协定开源，并首次支持119多种语言，全球开发者、研究机构和企业均可免费在魔搭社区、HuggingFace等平台下载模型并商用，也可以通过阿里云百炼调用Qwen3的API服务。个人用户可立即通过通义APP直接体验Qwen3，夸克也即将全线接入Qwen3。

　　至于Qwen3 的“混合推理”具体说明上，相当于把顶尖的推理模型和非推理模型集成到同一个模型，目前据称热门模型中只有Qwen3、Claude3.7以及Gemini 2.5 Flash可以做到。

　　在“推理模式”下，Qwen3会执行更多中间步骤，如分解问题、逐步推导、验证答案等，给出更深思熟虑的答案；在“非推理模式”下，模型会直接生成答案，让同一个模型内能完成“快思考”与“慢思考”。这类似于人类在回答简单问题时，凭经验或直觉快速作答，面对复杂难题时再深思熟虑，仔细思考给出答案。

　　同时，Qwen3的部署成本还大幅下降，仅需4张H20即可部署Qwen3满血版，显存占用仅为性能相近模型的三分之一。

实用资讯