资讯
此前星野和 Talkie 在商业化上的优异表现,让 MiniMax 早早成为一家可以自己独立行走的大模型公司,也让外界赋予了这家公司一个「产品驱动」这样过于笼统的标签。这一定程度上忽视了 MiniMax 在模型层面上相当强悍的研发能力。
14 小时
银柿财经 on MSNMiniMax开启“官宣周”,开源首个推理模型M16月17日,Minimax正式开源推理模型M1,采用Lightning ...
15 小时
华尔街见闻 on MSNMiniMax开源推理模型M1: 在进行8万Token的深度推理时,所需算力仅为 ...上海AI独角兽MiniMax正式开源推理模型MiniMax-M1(以下简称“M1”)。MiniMax称,这是全球首个开放权重的大规模混合注意力推理模型。凭借混合门控专家架构(Mixture-of-Experts,MoE)与 Lightning ...
经过验证对比,这种算法具备更高效率。如在数学测试基准AIME的实验中,MiniMax发现CISPO比字节近期提出的DAPO强化学习算法实现了两倍的加速,即其只需50%的训练步骤就可以与DAPO的表现相匹配,同时也显著优于DeepSeek此前使用的GR ...
6月17日,Minimax正式开源推理模型M1,采用Lightning Attention机制的混合注意力架构。M1支持目前业内最高100万token上下文输入,同时支持最多8万token输出。成本表现方面,M1在用8万Token深度推理的时候,需要使用DeepSeek R1约30%的算力。
一些您可能无法访问的结果已被隐去。
显示无法访问的结果