蚂蚁开源万亿参数思考模型,综合能力逼近GPT-5

来自:智东西
发布时间:7小时前

10月14日凌晨,蚂蚁集团正式推出万亿参数思考模型Ring-1T,并全面开源模型权重、训练配方。 Ring-1T在9月30日开源的预览版Ring-1T-preview基础上训练,研究人员基于IMO2025(国际数学奥利匹克)赛题,将Ring-1T接入多智能体框架AWorld,使用纯自然语言推理进行解题。实验结果显示,Ring-1T仅用一次解出了第1、3、4、5题,相当于IMO银牌水平,成为首个能拿IMO国际奥数奖的开源系统。Ring-1T在第三次尝试IMO时对第2题几何证明也给出了接近满分的证明过程,在顶流大模型几乎全军覆没的第六题中将答案收敛到与Gemini 2.5 Pro相同的“4048”(正确答案为2112)。 在“人类偏好对齐”测试Arena-Hard V2中,Ring-1T以81.59的成功率居于开源模型榜首,逼近GPT-5-Thinking(High)82.91的成绩。医疗问答HealthBench测评中,Ring-1T也以最高分取得开源领域最佳。

好文章,赞一下
1235
人工导购
咨询服务