lightning - 搜索 News

资讯

6月17日，MiniMax 发布了新模型MiniMax M1。这是一个继续激进地使用线性注意力 Lightning Attention机制的模型，同时它还巧妙地找到一种方式，将这种激进的预训练机制带来的长文本能力用到后训练阶段，提出一种全新的强化学习技巧，从而大幅提高了模型的推理能力。

作者｜王兆洋邮箱｜wangzhaoyang@pingwest.com要不要完全跟随 DeepSeek？这是每个仍想自己追逐基础模型圣杯的公司，在过去半年里一直面对的灵魂拷问。而 MiniMax 的答案很清楚，它要走自己的路。6月17日，MiniMax ...

2 小时

此前星野和 Talkie 在商业化上的优异表现，让 MiniMax 早早成为一家可以自己独立行走的大模型公司，也让外界赋予了这家公司一个「产品驱动」这样过于笼统的标签。这一定程度上忽视了 MiniMax 在模型层面上相当强悍的研发能力。

银柿财经 on MSN18 小时

6月17日，Minimax正式开源推理模型M1，采用Lightning ...

华尔街见闻 on MSN19 小时

上海AI独角兽MiniMax正式开源推理模型MiniMax-M1（以下简称“M1”）。MiniMax称，这是全球首个开放权重的大规模混合注意力推理模型。凭借混合门控专家架构（Mixture-of-Experts，MoE）与 Lightning ...

19 小时

经过验证对比，这种算法具备更高效率。如在数学测试基准AIME的实验中，MiniMax发现CISPO比字节近期提出的DAPO强化学习算法实现了两倍的加速，即其只需50%的训练步骤就可以与DAPO的表现相匹配，同时也显著优于DeepSeek此前使用的GR ...

南方都市报 on MSN21 小时

DeepSeek掀起推理模型热潮近半年之后，MiniMax于6月17日发布并开源其首款推理模型M1。按照官方说法，M1一项显著优势是支持目前业内最高的100万Token的上下文输入长度——为DeepSeek ...

1 天

6月17日，Minimax正式开源推理模型M1，采用Lightning Attention机制的混合注意力架构。M1支持目前业内最高100万token上下文输入，同时支持最多8万token输出。成本表现方面，M1在用8万Token深度推理的时候，需要使用DeepSeek R1约30%的算力。

6月17日，MiniMax开源混合架构推理模型M1。M1模型采用MoE与lightning attention相结合架构，模型大小为456B ，单token激活参数为45.9 B，M1原生支持100万token的上下文长度，包含40K和80K思维预算两个推理模型。（钛媒体 AGI ） ...

2 天

安克A82432 Lightning数据线超值推荐！它的端子头采用苹果C89原装铑钌端子头，还通过了苹果MFi官方认证，能支持IOS全系列充电。线身方面，外被是柔韧的TPE材质，内部有20AWG数据线芯和30AWG电力线芯，这使得充电稳定。并且它支持2.4A大电流充电，线长1.8m，颜色为白色。

上个月，马斯克在自己的社澳门精准免费这里大全交媒体平台X上，与德国选择党领导人魏德尔进行了75分钟的对谈。另外，他还意外通过视频连线出席选择党集会，并发表一系列争议言论。马斯克的行为遭到德国总理朔尔茨，以及最有希望成为下一届德国总理的基民盟领导人默茨 ...

7 天on MSN

IT之家 6 月 10 日消息，AMD 在 2024 年推出了 A620A 芯片组，官网将其和此前推出的 A620 列在一起，并宣称具有相同的核心规格参数。不过根据华擎提供的主板方框图 (Block Diagram) ，A620A 和 A620 ...

一些您可能无法访问的结果已被隐去。