(资料图片)
上证报中国证券网讯(记者孙小程)2026年春节前夕,MiniMax正式上线新一代文本模型MiniMaxM2.5,参与到大模型厂商密集上新的“春节档”中。在编程能力方面,M2.5在权威榜单SWE-BenchVerified得分80.2%、Multi-SWE-Bench得分51.3%,较上一代显著提升;在Multi-SWE-Bench等多语言复杂环境中超越Opus4.6。模型展现出“原生Spec能力”——在编码前主动拆解架构与功能规划,更接近真实架构师的工作模式。
工具调用和搜索能力方面,模型能够自动处理复杂任务,在BrowseComp、WideSearch等多项Agent任务中以更低的轮次消耗取得了更优的效果,相较于上一代模型表现提升20%。
办公场景中,在Word、PPT、Excel金融建模等Workspace高阶场景中取得了显著的能力提升,在测评框架GDPval-MM与主流模型的对比中取得了59.0%的平均胜率。
性能之外,M2.5的另一核心亮点在于推理速度与成本控制。M2.5-lightning版本支持100TPS以上输出速度,是主流模型的2倍左右;输入价格约0.3美元/百万Token,输出约2.4美元/百万Token。
按每秒输出100Token计算,M2.5连续运行一小时成本约1美元;若按50Token计算,成本约0.3美元。MiniMax方面认为,当性能与成本不再构成约束,Agent规模化部署的经济模型将发生根本变化。
六组数据,读懂大国消费新气象
2月11日山东金岭二氯甲烷散水出厂价下调70元 吨,目前大王厂1630元 吨
天眼查App显示,近日,镇江亿蒙电力科技有限公司成立,法定代表人为肖
证券日报网讯2月10日,先锋精科在互动平台回答投资者提问时表示,公司
ArgusResearch将微芯科技的目标价从75美元上调至95美元,维持“买入”
X 关闭
X 关闭
四川广安市48小时内将新改建一个800张床位的方舱医院 记者从今日(19日)中午召开的广安市疫情防控发布会上获悉,广安市应急指挥部决[+更多]
河南:6月底前实现“场所码”全覆盖 “场所码”是流调的关键,是落实常态化疫情防控的重要举措。记者从河南省新冠肺炎疫情防控指挥[+更多]
中新网上海5月19日电 (陈静 朱虹 丁国莲)记者19日获悉,中国学者的最新研究解释,证实了糖尿病的卵母细胞起源,揭示了糖尿病代际遗[+更多]
中新社合肥5月19日电 题:虚拟人走红“Z世代”:未来虚拟人懂情感有温度 中新社记者 张俊 俏皮可爱的虚拟人形象、顺畅自然的肢[+更多]