继今年1月DeepSeek-R1震惊世界之后,全球对中国的AI模型也越来越关注和期待。
7月11日,国内AI初创公司北京月之暗面科技有限公司(简称“月之暗面”),发布了最新一款万亿参数开源模型Kimi K2,再次引发全球热议。
当地时间7月16日,英国《自然》杂志发表文称:“中国AI模型Kimi K2,是又一个DeepSeek 时刻”。
中国大模型霸榜前三,Kimi K2登顶全球开源榜
7月18日,国际权威大模型排行榜LMArena揭晓最新排名:月之暗面开源模型Kimi K2强势登顶全球开源模型榜首!
值得注意的是,在全球开源模型排行榜中,前三均来自我国,包括Kimi K2、DeepSeek R1、阿里Qwen3,领先于谷歌Gemma3和Meta旗下Llama4。
其中,Kimi K2还获得了超3000张社区投票,在大模型竞技场的总榜上排名第五。
全球最大开源AI平台Hugging Face的数据显示,Kimi K2发布仅一天后,下载量就超过了平台上的任何其他模型。Hugging Face联合创始人托马斯(Thomas)评价称:“来自中国的Kimi团队在过去几个月推出的系列模型令人印象深刻,K2更是挑战了闭源模型的极限。”
另外,华盛顿州西雅图艾伦人工智能研究所的机器学习研究员内森·兰伯特(Nathan Lambert)在其通讯《互联》(Interconnects)中写道。“六个月内,中国又诞生了第二款令人印象深刻的模型,这表明这一壮举并非偶然。“今年早些时候发布的DeepSeek R1更像是人工智能发展轨迹中的前传,而非昙花一现,”他在社交媒体网站Bluesky上写道,Kimi K2是“全球最佳的全新开放模型”。
美国CNBC报道称,该模型在编码方面超越了ChatGPT和Claude,而且成本更低。报道称,与DeepSeek一样,Kimi K2 模型是一种低成本、开源的大型语言模型。除了Meta和谷歌(某种程度上)之外,很少有美国科技巨头开源技术免费提供源代码访问。巧合的是,OpenAI首席执行官 Sam Altman于周六凌晨宣布,由于安全问题,其首个开源模型将再次无限期推迟。
K2的发布,也引起了英伟达创始人黄仁勋的注意。在北京参加链博会期间接受媒体采访时,黄仁勋表示:“中国人工智能最近进步迅猛,DeepSeek R1、阿里巴巴Qwen、Moonshot AI的Kimi这些模型都非常先进。”
7月13日,美国AI搜索初创公司Perplexity CEO阿拉温德(Aravind Srinivas)在社交媒体公开表示,基于Kimi K2模型的良好表现,公司后续可能很快利用K2进行后训练。
7月15日消息,近日,包括OpenRouter、Visual Studio Code、硅基流动、金山云、无问芯穹、纳米AI、欧派云在内的多家科技公司接连宣布接入和部署Kimi K2。
月之暗面投资方,小红书、美团、阿里、腾讯等
作为该模型的出品公司,月之暗面(Moonshot AI)成立于2023年3月,投资方都是中国头部企业,包括红杉中国、小红书、美团、阿里、腾讯等。
去年2月,“月之暗面”完成了新一轮融资,金额超10亿美元(约合71亿人民币),投资方包括红杉中国、小红书、美团、阿里等。创下(彼时)ChatGPT爆火以来,国内AI大模型公司单轮最大金额融资。
公司核心成员多出身清华系,创始团队核心成员参与了 Google Gemini、Google Bard、盘古NLP、悟道等多个大模型的研发,多项核心技术被Google PaLM、Meta LLaMa、Stable Diffusion等主流产品采用。
创始人兼CEO,杨植麟,出生于1992年,为清华大学交叉信息研究院助理教授,是国内顶尖的AI研究者,被誉为“中国大模型90后第一人”。
2024年,月之暗面因推出了具备长文本分析和AI搜索功能的Kimi模型而迅速走红,吸引了大量用户关注。
KimiK2,出色代码和通用Agent任务能力
Kimi K2是月之暗面7月11日发布的最新的一款万亿参数开源模型,强调代码能力和通用Agent任务能力。
据官方消息,在SWE Bench Verified、Tau2、AceBench 等基准性能测试中,Kimi K2 均取得开源模型中的SOTA 成绩,展现出在代码、Agent、数学推理任务上的领先能力。
Kimi K2 的预训练阶段使用 MuonClip 优化器实现万亿参数模型的稳定高效训练,在人类高质量数据成为瓶颈的背景下,有效提高 Token 利用效率,找到新的 Scaling 空间。
代码能力方面。在前端开发任务中,Kimi K2 擅长生成兼具设计感与视觉表现力的代码,支持粒子系统、可视化和 3D 场景等表现形式,具备较强的图形能力与交互性。
Agent工具调用能力方面。比如,将13万行的原始数据丢给 Kimi K2,他可以帮你分析远程办公比例对薪资的影响,分析显著差异,自动生成统计图表与回归模型解读,并用统一色调做出小提琴图(violin plot) 、箱线图(box plot)、散点图(scatter plot)等专业图表,整理成报告。
此外,在改写任务中,Kimi K2 也能准确控制输出风格,无论是用初中生语气改写科研文本,还是模仿苹果广告文案,都能同时保留原意与表达风格,体现较强的语境保持和表达迁移能力。
7月11日,Kimi K2的 API 服务已全面上线,支持最长128K上下文,具备更强的通用性与工具调用能力。计费方面,每百万输入tokens:4 元;每百万输出 tokens:16 元。仅为领先专有模型(例如Anthropic公司的Claude 4)的一小部分。
同时,Kimi K2兼容 OpenAI 和 Anthropic 两种 API 格式,也可以与各类框架良好兼容。此外,月之暗面还称,全新升级的 ToolCall 能力,可以严格保障格式正确性,适用于复杂 Agent 任务。
随着该模型在全球出圈,由于访问量庞大,和DeepSeek类似,Kimi K2模型也出现API速度慢的问题。
7月15日晚间,月之暗面还发布公告称,Kimi K2 API速度慢的情况正在解决中。月之暗面称,主要问题是访问量大+模型体积大。公司正在全力优化推理效率,也在加卡加机器。预计这几天内速度会有明显提升。
同时,月之暗面还表示,KimiK2是完全开源的,大家也可以通过其他模型供应商接入使用(比如硅基流动、无问芯穹等)。也欢迎自行部署!
国内配资官网提示:文章来自网络,不代表本站观点。