icon

解密底牌:MiniMax发布M2技术报告,详述MoE底座与Agent训练系统

据动察 Beating 监测,继预告 M3 稀疏注意力后,MiniMax 在 arXiv 提交了 M2 系列 35 页技术报告,首次系统归档了旗舰级 MoE 架构设计、数据管线与 Agent 原生基础设施。报告详述了早期 M1 探索混合线性注意力路线后,M2 选择配合 GQA 重回全注意力路线的技术妥协,并展示了如何用 MTP、Sigmoid 路由和 Forge 在推理与训练两端补成本短板,同时首次披露了超长上下文 Agent RL 训练系统 Forge 与 M2.7 的自进化机制。其中,Forge 引入窗口化 FIFO 调度与前缀树合并技术,在长序列 Agent 强化学习中最高实现 40 倍训练提速。此外,M2.7 首次展示智能体「自进化」闭环,可自主完成超 100 轮分析、改代码、跑评测与回退流程,使内部评测性能提升 30%。性能方面,单 token 激活 9.8B 参数的 M2.7 在 SWE-Pro 上取得 56.22%,Multi-SWE-bench 达 52.7%,MLE Bench 平均奖牌率达到 66.6%,表现接近 Gemini 3.1。
雷電財經提醒:請廣大讀者理性看待區塊鏈,切實提高風險意識,警惕各類虛擬代幣發行與炒作,站內所有內容僅系市場信息或相關方觀點,不構成任何形式投資建議。如發現站內內容含敏感信息,可通過 舉報 聯繫我們 ,我們會及時處理。
13:42 , 2026-05-27

解密底牌:MiniMax发布M2技术报告,详述MoE底座与Agent训练系统