您当前的位置：环球传媒网 - 环球资讯网 - 环球生活门户>信息 > 正文

阿里开源新架构Qwen3-Next，模型训练成本降9成，长文本推理吞吐提升10倍

2025-09-12 08:24:16 来源：每日经济新闻编辑：

每经杭州9月12日电（记者叶晓丹）9月12日，阿里通义发布下一代基础模型架构Qwen3-Next。Qwen3-Next针对大模型在上下文长度和总参数两方面不断扩展（Scaling）的未来趋势而设计，采用全新的高稀疏MoE架构，并对经典Transformer核心组件进行了重构，创新采用线性注意力和自研门控注意力结合的混合注意力机制，实现了模型训练和推理的双重性价比突破。

基于这一新架构，阿里通义“打样”了Qwen3-Next-80B-A3B系列模型，开源指令（Instruct）和推理（Thinking）两大模型版本。新模型总参数80B仅激活3B，性能可媲美千问3旗舰版235B模型，模型计算效率大幅提升。Qwen3-Next训练成本较密集模型Qwen3-32B大降超90%，长文本推理吞吐量提升10倍以上，并可支持百万Tokens（文本处理的最小单位‌）超长上下文。

关键词：推理上下文 qwen 阿里巴巴集团深度思

相关阅读

分享到：

版权和免责申明

凡注有"环球传媒网 - 环球资讯网 - 环球生活门户"或电头为"环球传媒网 - 环球资讯网 - 环球生活门户"的稿件，均为环球传媒网 - 环球资讯网 - 环球生活门户独家版权所有，未经许可不得转载或镜像；授权转载必须注明来源为"环球传媒网 - 环球资讯网 - 环球生活门户"，并保留"环球传媒网 - 环球资讯网 - 环球生活门户"的电头。

阿里开源新架构Qwen3-Next，模型训练成本降2025-09-12
18门课程诚意来袭！苏州市“青年夜校”秋季2025-09-12
湖南一废旧小区变成垃圾场部门回应：用了2025-09-12
海天味业(03288.HK)获GIC Private Limite2025-09-12
阿里推出更高效的Qwen3-Next人工智能模型 2025-09-12
今年以来A股再融资规模逾8000亿元-头条2025-09-12
热资讯！新吴区曈曈零食店（个体工商户）成2025-09-12
健友股份：连续4日融资净买入累计1451.1万2025-09-12
首开股份7天大涨90% 间接持有宇树科技0.3%2025-09-12
今日报丨中国金融租赁(02312)8月末每股资产2025-09-12
每日观点:必得科技：股东拟减持不超过0.05%2025-09-12
招商证券上调科士达评级2025-09-12
中国金融租赁(02312.HK)8月末每股资产净值02025-09-12
南京江旺再生资源有限公司成立注册资本102025-09-12
简讯:Live Nation创2005年12月IPO上市以来历史新高2025-09-12
焦点信息:赢了！武汉女足拿下争冠关键3分2025-09-12
[快讯]海通发展141万限售股9月19日解禁|今2025-09-12
每日快看：美股异动 | Sandisk(SNDK.US)2025-09-12
快资讯丨视频丨“60秒直击东博会”——这场2025-09-12
焦点关注：罗永浩回应将被西贝创始人贾国龙2025-09-12
今日热议：10月份已售罄特斯拉Model Y 2025-09-12
热门中概股大涨，再鼎医药涨超11%，万国数2025-09-11
资金以非常夸张的速度冲向化工板块2025-09-11
【聚看点】[快讯]有方科技:有方科技：关于2025-09-11
百事通！金禾实业拟推第三期核心员工持股计2025-09-11
精选！希荻微：截至2025年6月30日，公司的2025-09-11
南宁又一文旅新地标，即将亮相！|焦点2025-09-11
第二届何蕾教育基金“最美特教人”出炉烈2025-09-11
千禾味业打造专属大豆生产基地引领调味品2025-09-11
今日观点!支付宝推出国内首个“AI付”：一2025-09-11

新视野

资讯

焦点