资讯

7月11日晚,月之暗面(Moonshot AI)推出最新旗舰模型 Kimi K2,开源、免费可商用这是Kimi首次开源基础模型,其市场反响强烈,其也被网友称作又一个“DeepSeek 时刻”。 Kimi ...
根据 InfoQ 的消息,Kimi K2 的架构设计与另一款开源大模型 DeepSeek V3 高度相似,两者均对 Transformer 架构作了改进:K2 减少了注意力头数量以提升长上下文效率,同时增加了专家数量以提高 token 利用率。
Kimi K2是一个万亿(1T)参数规模的混合专家(MoE)模型,激活参数为320亿。其核心能力发生了清晰的转向,在延续Kimi此前的标签“长文本(128K)”的特性下,为智能体任务做了专门优化,天生为智能体构建而设计。
近期,Aider Leaderboard的最新测试结果震撼发布,Moonshot AI推出的开源模型Kimi ...
自一个月前xbench公布第一期Leaderboard以来,AI大模型界又迎来了新一轮的“你追我赶”。上周,xAI发布了“全球最强大的”Grok-4,两天后,Kimi推出并开源了“一万亿参数”的K2模型。xbench对这两个“新玩家”火速进行了测评, ...
LONDON, July 18 (Xinhua) -- The prestigious scientific journal Nature has hailed China's latest artificial intelligence (AI) model, Kimi K2, as "another DeepSeek moment" for the global AI community.
据报道,中国AI模型Kimi K2在全球开源模型排名中超越DeepSeek成为新的开源第一总排名第五紧追Grok 4等顶尖闭源模型。Kimi K2在过去一周内获得了GitHub标星5.6K和Hugging Face下载量近10万的优异成绩。此外Perplexity CEO透露计划基于Kimi K2进行后训练。尽管Kimi K2继承了DeepSeek ...
文章认为, Kimi K2是 继1月DeepSeek推出R1震惊世界之后, 六个月内中国推出的第二款令人瞩目的模型 , 这表明这并非偶然之举。 Hugging Face的数据显示,Kimi ...
一是 V3 架构珠玉在前且已经经过大规模验证,没必要强行“标新立异”;二是自己和 DeepSeek 一样,训练和推理资源非常有限,而经过评估 V3 架构符合相关成本预算。 虽然总参数增大到 1.5 倍,但除去通信部分,理论的 prefill 和 decode 耗时都更小。即使考虑与通信 overlap 等复杂因素,这个方案也不会比 V3 有显著的成本增加。
这次发布赶在了最近全球大模型集中发布的风口浪尖,前有 xAI 的 Grok 4,下周可能还有谷歌新 Gemini 和 OpenAI 开源模型,看起来大模型来到了一个新的技术节点。或许是感受到了 Kimi K2 ...
新浪科技通过月之暗面获取的OpenRouter最新数据显示,目前,Kimi K2调用量与马斯克刚发布的Grok4分别登上增长榜前两名,日调用量超过100亿token。Kimi K2的API价格仅为Claude中型模型Sonnet的五分之一,Claude大型模型Opus的二十五分之一。
KimiK2的发布几乎没什么预兆。 2025年7月11日深夜,月之暗面直接开源了这个万亿参数模型,整个AI圈子一下子就热闹起来。模型的能力很强,尤其是在代码和Agent任务上,没多久,它就和Grok4一起出现在了马斯克转发的热门模型趋势榜单上。 热度是有了,但这次的感觉和以往很不一样。 很多人还记得月之暗面曾经在市场投放上花巨额预算的那段时期。根据公开信息,当时为了给产品引流,公司曾在多个平台进行 ...