资讯
Kimi K2并非只有规模上的震撼,其独特之处在于对编程和智能体类任务的卓越表现。据Kimi公布的测评结果显示,Kimi K2在自主编程、工具调用和数学推理三个维度上,均超越了同为开源模型的DeepSeek-V3和阿里Qwen3。这一成绩无疑为Kimi K2赢得了业界的广泛认可。
这次发布赶在了最近全球大模型集中发布的风口浪尖,前有 xAI 的 Grok 4,下周可能还有谷歌新 Gemini 和 OpenAI 开源模型,看起来大模型来到了一个新的技术节点。或许是感受到了 Kimi K2 ...
17 小时
华尔街见闻 on MSN中国模型霸榜前三,Kimi K2登顶全球开源模型冠军据全球大模型竞技场LMArena消息,开源模型与闭源模型的竞争进一步升级。在全球开源模型排行榜中,Kimi K2、DeepSeek R1、Qwen3等3个来自中国的开源模型排名前三,领先于谷歌Gemma3和Meta旗下Llama4,Kimi ...
此前,Kimi在海外知名度有限,但K2的爆火已经带来实在的回报:全球开发者圈子里开始关注起Kimi,有人开始研究CEO杨植麟的过往经历。开发者们喜欢这个充满朋克文化的团队——Kimi团队成员在小红书、推特展示公司里以传奇乐队命名的会议室,也会在Twi ...
7月11日, Moonshot AI 正式发布了Kimi K2模型,并同步开源。它具备更强代码能力、更擅长通用Agent任务的MoE (Mixture-of-Experts,混合专家) 架构基础模型,总参数1T (1万亿) ,激活参数32B。
1 天
人民网 on MSN中国AI模型“又一个DeepSeek时刻”本文转自:湄洲日报英国《自然》杂志网站7月16日发表文章说,中国人工智能(AI)模型KimiK2发布后引发轰动,世界迎来“又一个DeepSeek时刻”。中国在6个月内推出第二款令人印象深刻的模型,表明这一成功并非偶然。文章摘要如下:继今年1月DeepSeek-R1震惊世界之后,全球研究人员对中国推出 ...
Kimi K2是一个万亿(1T)参数规模的混合专家(MoE)模型,激活参数为320亿。其核心能力发生了清晰的转向,在延续Kimi此前的标签“长文本(128K)”的特性下,为智能体任务做了专门优化,天生为智能体构建而设计。
一是 V3 架构珠玉在前且已经经过大规模验证,没必要强行“标新立异”;二是自己和 DeepSeek 一样,训练和推理资源非常有限,而经过评估 V3 架构符合相关成本预算。 虽然总参数增大到 1.5 倍,但除去通信部分,理论的 prefill 和 decode 耗时都更小。即使考虑与通信 overlap 等复杂因素,这个方案也不会比 V3 有显著的成本增加。
7月11日晚,月之暗面(Moonshot AI)推出最新旗舰模型 Kimi K2,开源、免费可商用这是Kimi首次开源基础模型,其市场反响强烈,其也被网友称作又一个“DeepSeek 时刻”。 Kimi ...
新华社伦敦7月16日电(记者郭爽)英国《自然》杂志网站16日发表文章说,中国人工智能(AI)模型Kimi K2发布后引发轰动,世界迎来“又一个DeepSeek时刻”。中国在6个月内推出第二款令人印象深刻的模型,表明这一成功并非偶然。文章摘要如下: ...
近期,Aider Leaderboard的最新测试结果震撼发布,Moonshot AI推出的开源模型Kimi ...
1 天
每日经济新闻 on MSN通信ETF(515880)涨超2.2%,大模型技术迭代驱动算力需求江海证券指出,大模型国内外厂商进展不断,算力板块持续受益。Kimi K2模型采用混合专家(MoE)架构,总参数规模达1万亿,激活参数320亿,在多项权威基准测试中取得开源模型最优成绩,并显著优于同量级开源模型。 Grok ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果