资讯

文|邓咏仪 编辑|苏建勋 发布开源模型K2一周后,Kimi引起的全球热潮还在继续。 7月11日,月之暗面(Moonshot AI)开源了万亿参数的MoE模型Kimi K2。这是一个参数高达1T,激活参数32B的MoE模型,包括两款开源模型版本Kimi ...
在全球人工智能(AI)领域,一场激烈的竞争正在悄然展开。国际数据公司(IDC)预测,到2024年,全球各组织在AI上的投入将达到2350亿美元,而到2028年,这一数字将跃升至6300亿美元,年复合增长率接近30%。开源大模型,以其开放、透明和可定制 ...
随着VR、大数据、AI 这些新技术的快速迭代,新闻宣传领域正经历前所未有的变革。作为一名新媒体编辑,笔者在尝试梳理DeepSeek ...
《法治新闻传播》2025年第3期检察宣传运用DeepSeek的理论分析和应用对策作者:臧明宏随着人工智能技术的快速发展,其在司法领域的应用日益广泛。作为人工智能技术的重要代表,DeepSeek在自然语言处理和数据分析方面展现出强大能力,为检察宣传工作 ...
在关注者数量上,DeepSeek以78k遥遥领先,显示出其在多模态理解领域的广泛影响力。Meta ...
七月的热浪席卷北京中关村,一组冰冷数据却在科技圈投下震撼弹:中国用户量最大的AI产品DeepSeek,三个月流失2500万活跃用户。官网流量从年初巅峰时期的7.5%跌至3%,断崖式下滑的曲线在投资人手机屏幕上格外刺眼。当所有人以为这家明星公司要慌了手 ...
此前,他在法国INRIA格勒诺布尔中心获得了博士学位,师从Zaid Harchaoui和Julien Mairal教授。期间,他首创了一阶优化算法的通用加速框架,为后续应用科学研究奠定了重要理论基础。
Kimi K2并非只有规模上的震撼,其独特之处在于对编程和智能体类任务的卓越表现。据Kimi公布的测评结果显示,Kimi K2在自主编程、工具调用和数学推理三个维度上,均超越了同为开源模型的DeepSeek-V3和阿里Qwen3。这一成绩无疑为Kimi K2赢得了业界的广泛认可。
据台湾自由时报7月15报道:南京红姐事件近期引发广泛讨论,其中受害者一句“来都来了”,成为网路最红台词。对此,有网友尝试询问中国AI ...
一是 V3 架构珠玉在前且已经经过大规模验证,没必要强行“标新立异”;二是自己和 DeepSeek 一样,训练和推理资源非常有限,而经过评估 V3 架构符合相关成本预算。 虽然总参数增大到 1.5 倍,但除去通信部分,理论的 prefill 和 decode 耗时都更小。即使考虑与通信 overlap 等复杂因素,这个方案也不会比 V3 有显著的成本增加。
近日,由普林斯顿大学牵头,联合清华大学、北京大学、上海交通大学、斯坦福大学,以及英伟达、亚马逊、Meta FAIR 等多家顶尖机构的研究者共同推出了新一代开源数学定理证明模型——Goedel-Prover-V2。
DeepSeek是由杭州深度求索人工智能基础技术研究有限公司开发的新一代AI大模型。其核心优势在于强大的推理引擎能力,融合了自然语言处理(NLP)、深度学习、大规模数据分析等前沿技术。DeepSeek-R1具备卓越的逻辑推理、多模态分析(文本/图像/语音)和实时交互能力,能够高效处理代码生成、复杂问题求解、跨模态学习等高阶任务。凭借其开源、高效、多模态的技术特性,DeepSeek正加速推动AI在金 ...