您当前的位置 :环球传媒网 - 环球资讯网 - 环球生活门户>信息 > 正文
阿里开源新架构Qwen3-Next,模型训练成本降9成,长文本推理吞吐提升10倍
2025-09-12 08:24:16 来源:每日经济新闻
每经杭州9月12日电(记者叶晓丹)9月12日,阿里通义发布下一代基础模型架构Qwen3-Next。Qwen3-Next针对大模型在上下文长度和总参数两方面不断扩展(Scaling)的未来趋势而设计,采用全新的高稀疏MoE架构,并对经典Transformer核心组件进行了重构,创新采用线性注意力和自研门控注意力结合的混合注意力机制,实现了模型训练和推理的双重性价比突破。
基于这一新架构,阿里通义“打样”了Qwen3-Next-80B-A3B系列模型,开源指令(Instruct)和推理(Thinking)两大模型版本。新模型总参数80B仅激活3B,性能可媲美千问3旗舰版235B模型,模型计算效率大幅提升。Qwen3-Next训练成本较密集模型Qwen3-32B大降超90%,长文本推理吞吐量提升10倍以上,并可支持百万Tokens(文本处理的最小单位)超长上下文。
相关阅读
版权和免责申明
凡注有"环球传媒网 - 环球资讯网 - 环球生活门户"或电头为"环球传媒网 - 环球资讯网 - 环球生活门户"的稿件,均为环球传媒网 - 环球资讯网 - 环球生活门户独家版权所有,未经许可不得转载或镜像;授权转载必须注明来源为"环球传媒网 - 环球资讯网 - 环球生活门户",并保留"环球传媒网 - 环球资讯网 - 环球生活门户"的电头。
- 阿里开源新架构Qwen3-Next,模型训练成本降2025-09-12
- 18门课程诚意来袭!苏州市“青年夜校”秋季2025-09-12
- 湖南一废旧小区变成垃圾场 部门回应:用了2025-09-12
- 海天味业(03288.HK)获GIC Private Limite2025-09-12
- 阿里推出更高效的Qwen3-Next人工智能模型 2025-09-12
- 今年以来A股再融资规模逾8000亿元-头条2025-09-12
- 热资讯!新吴区曈曈零食店(个体工商户)成2025-09-12
- 健友股份:连续4日融资净买入累计1451.1万2025-09-12
- 首开股份7天大涨90% 间接持有宇树科技0.3%2025-09-12
- 今日报丨中国金融租赁(02312)8月末每股资产2025-09-12
- 每日观点:必得科技:股东拟减持不超过0.05%2025-09-12
- 招商证券上调科士达评级2025-09-12
- 中国金融租赁(02312.HK)8月末每股资产净值02025-09-12
- 南京江旺再生资源有限公司成立 注册资本102025-09-12
- 简讯:Live Nation创2005年12月IPO上市以来历史新高2025-09-12
- 焦点信息:赢了!武汉女足拿下争冠关键3分2025-09-12
- [快讯]海通发展141万限售股9月19日解禁|今2025-09-12
- 每日快看:美股异动 | Sandisk(SNDK.US)2025-09-12
- 快资讯丨视频丨“60秒直击东博会”——这场2025-09-12
- 焦点关注:罗永浩回应将被西贝创始人贾国龙2025-09-12
- 今日热议:10月份已售罄 特斯拉Model Y 2025-09-12
- 热门中概股大涨,再鼎医药涨超11%,万国数2025-09-11
- 资金以非常夸张的速度冲向化工板块2025-09-11
- 【聚看点】[快讯]有方科技:有方科技:关于2025-09-11
- 百事通!金禾实业拟推第三期核心员工持股计2025-09-11
- 精选!希荻微:截至2025年6月30日,公司的2025-09-11
- 南宁又一文旅新地标,即将亮相!|焦点2025-09-11
- 第二届何蕾教育基金“最美特教人”出炉 烈2025-09-11
- 千禾味业打造专属大豆生产基地 引领调味品2025-09-11
- 今日观点!支付宝推出国内首个“AI付”:一2025-09-11