当前位置:易索资讯>>易索论坛>>[生活/情感/求助]
主题
正在载入……
哇小宁 于 2025-4-29 9:36 发布于 [生活/情感/求助] 点击:53 回复:3

阿里开源新一代通义千问模型Qwen3

正文
PM 信息 回复 编辑 删除 管理

4月29日凌晨,阿里巴巴开源新一代通义千问模型Qwen3(简称千问3),参数量为DeepSeek-R1的1/3,成本大幅下降。千问3是“混合推理模型”,“快思考”与“慢思考”集成进同一个模型,对简单需求可低算力“秒回”答案,对复杂问题可多步骤“深度思考”,节省算力消耗。

千问3总参数量235B,激活仅需22B。阿里称仅需4张H20即可部署千问3满血版,显存占用仅为性能相近模型的三分之一。

千问3模型版本包含2款30B、235B的MoE模型,以及0.6B、1.7B、4B、8B、14B、32B等6款密集模型。API可按需设置“思考预算”(即预期最大深度思考的tokens数量),进行不同程度的思考,满足AI应用和不同场景对性能和成本的多样需求。比如,4B模型面向手机端,8B可在电脑和汽车端侧部署应用等。

点亮
0
复印
0
———————————————以下为[哇小宁]的签名—————————————————
主题列表
查看全部
只看作者回帖
只看我的回帖
阿里开源新一代通义千问模型Qwen3 哇小宁 2025-4-29 9:36[] <567字> 0复印0
他不是回答你了。。。 哇小宁 2025-4-29 10:31[] <空> 0复印0
您未登录,不能回复主题,点击登录并回复此主题