资讯
一是 V3 架构珠玉在前且已经经过大规模验证,没必要强行“标新立异”;二是自己和 DeepSeek 一样,训练和推理资源非常有限,而经过评估 V3 架构符合相关成本预算。 虽然总参数增大到 1.5 倍,但除去通信部分,理论的 prefill 和 decode 耗时都更小。即使考虑与通信 overlap 等复杂因素,这个方案也不会比 V3 有显著的成本增加。
Kimi ...
自一个月前xbench公布第一期Leaderboard以来,AI大模型界又迎来了新一轮的“你追我赶”。上周,xAI发布了“全球最强大的”Grok-4,两天后,Kimi推出并开源了“一万亿参数”的K2模型。xbench对这两个“新玩家”火速进行了测评, ...
据报道,中国AI模型Kimi K2在全球开源模型排名中超越DeepSeek成为新的开源第一总排名第五紧追Grok 4等顶尖闭源模型。Kimi K2在过去一周内获得了GitHub标星5.6K和Hugging Face下载量近10万的优异成绩。此外Perplexity CEO透露计划基于Kimi K2进行后训练。尽管Kimi K2继承了DeepSeek ...
文章认为, Kimi K2是 继1月DeepSeek推出R1震惊世界之后, 六个月内中国推出的第二款令人瞩目的模型 , 这表明这并非偶然之举。 Hugging Face的数据显示,Kimi ...
7月11日晚,月之暗面(Moonshot AI)推出最新旗舰模型 Kimi K2,开源、免费可商用这是Kimi首次开源基础模型,其市场反响强烈,其也被网友称作又一个“DeepSeek 时刻”。 Kimi ...
新模型K2非常擅长工具调用,属于“自Claude 3.5 Sonnet以来,能放心用于生产力级别任务的模型”。 与此同时,本来传言本周上线的OpenAI开源模型无限期推迟,理由还是“安全考量”。 大家不免猜测,这不会是被K2影响了吧? 众多热议之下,才休息两天的Kimi工程师也进一步透露了模型背后更多细节。 值得一提的是,还有网友发现Kimi K2背后用的是DeepSeek V3的架构。 此次Ki ...
LONDON, July 18 (Xinhua) -- The prestigious scientific journal Nature has hailed China's latest artificial intelligence (AI) model, Kimi K2, as "another DeepSeek moment" for the global AI community.
2 小时on MSN
文|邓咏仪 编辑|苏建勋 发布开源模型K2一周后,Kimi引起的全球热潮还在继续。 7月11日,月之暗面(Moonshot AI)开源了万亿参数的MoE模型Kimi K2。这是一个参数高达1T,激活参数32B的MoE模型,包括两款开源模型版本Kimi ...
在AI竞技场上,一款名为Kimi K2的开源模型近日掀起了一场不小的风波。据最新消息,Kimi K2在激烈的竞争中脱颖而出,成功超越了DeepSeek,荣登全球开源模型榜首,同时跻身总榜第五,与马斯克旗下的顶尖闭源模型Grok 4并驾齐驱。
🥡 外卖三巨头被约谈 📦 苹果起诉 iOS 26 爆料人:提前泄密 🍷 消息称黄仁勋与 MiniMax 创始人「密会」 🏭 雷军陪比亚迪王传福参观小米汽车工厂 🍏 AI 编程巨头被曝国区断供模型 💻 Meta 再挖走两位苹果 AI 关键人物 🎉 超过 DeepSeek R1,Kimi K2 拿下开源模型第一 💡 何小鹏:中国 L3 级智驾或将超越美国 🚗 贾跃亭宣布法拉第首款 M ...
2 天
人人都是产品经理 on MSN深度研究Kimi K2:模型对比和实测最近模型圈大家关注度最高的莫过于Grok4以及Kimi K2,作为一个AI应用开发者,我们一直都时刻关注最新的模型能力表现,因此今天三白花了一天左右的时间先深入研究和实测一下K2的表现,看有没有媒体吹嘘的那么牛。
一些您可能无法访问的结果已被隐去。
显示无法访问的结果