资讯

人人都是产品经理 on MSN1 天
深度研究Kimi K2:模型对比和实测
最近模型圈大家关注度最高的莫过于Grok4以及Kimi K2,作为一个AI应用开发者,我们一直都时刻关注最新的模型能力表现,因此今天三白花了一天左右的时间先深入研究和实测一下K2的表现,看有没有媒体吹嘘的那么牛。
近期,Aider Leaderboard的最新测试结果震撼发布,Moonshot AI推出的开源模型Kimi ...
7月16日,三大股指早盘窄幅震荡,其中人工智能板块持续拉升。截止上午9:40,人工智能AIETF(515070)涨1.66%。相关成分股中,新易盛涨8.85%、寒武纪涨4.32%、中际旭创涨1.68%,韦尔股份、中科曙光、金山办公等小幅跟涨。
这次发布赶在了最近全球大模型集中发布的风口浪尖,前有 xAI 的 Grok 4,下周可能还有谷歌新 Gemini 和 OpenAI 开源模型,看起来大模型来到了一个新的技术节点。或许是感受到了 Kimi K2 ...
根据 InfoQ 的消息,Kimi K2 的架构设计与另一款开源大模型 DeepSeek V3 高度相似,两者均对 Transformer 架构作了改进:K2 减少了注意力头数量以提升长上下文效率,同时增加了专家数量以提高 token 利用率。
一、Kimi K2,国产LLM又迎来一个“Deepseek”时刻7月11日晚,月之暗面(Moonshot AI)推出最新旗舰模型 Kimi K2,开源、免费可商用这是Kimi首次开源基础模型,其市场反响强烈,其也被网友称作又一个“DeepSeek ...
Kimi-K2使用名为MuonClip的新训练算法,在规模达到15.5万亿tokens的训练中保持稳定。该算法通过定期调整注意力机制中的关键参数,成功避免了大模型常见的“训练崩溃”问题。
一是 V3 架构珠玉在前且已经经过大规模验证,没必要强行“标新立异”;二是自己和 DeepSeek 一样,训练和推理资源非常有限,而经过评估 V3 架构符合相关成本预算。 虽然总参数增大到 1.5 倍,但除去通信部分,理论的 prefill 和 decode 耗时都更小。即使考虑与通信 overlap 等复杂因素,这个方案也不会比 V3 有显著的成本增加。
据月之暗面披露的 OpenRouter 最新 数据,Kimi K2的调用量暴增,日均已突破100亿 token,与刚刚发布不久的马斯克旗下 Grok-4 并列 OpenRouter ...
针对近期用户集中反馈的Kimi K2模型API响应速度慢问题,AI创业公司月之暗面于7月15日晚间通过官方渠道发布声明,承认当前服务存在延迟,并表示正采取多项措施提升性能,预计未来几天内将实现明显改善。
文章认为, Kimi K2是 继1月DeepSeek推出R1震惊世界之后, 六个月内中国推出的第二款令人瞩目的模型 , 这表明这并非偶然之举。 Hugging Face的数据显示,Kimi ...
在SWE-bench Verified这个被称为"AI编程能力终极考验"的基准测试中,Kimi K2拿下了65.8%的成绩。要知道,GPT-4.1在同一测试中只有54.6%,就连业界标杆Claude Sonnet 4也只是略微领先。