资讯

面对陡然加大的竞争压力和市场环境的剧烈变化,这家“清华系”公司坚持住了自己的初心,并通过K2的发布证明了自己的实力。
近期,阿里通义千问在其技术版图上迈出了重要一步,正式推出了Qwen3模型的全新旗舰版本——Qwen3-235B-A22B-Instruct-2507-FP8。这一新版本特别引入了非思考模式(Non-thinking)的改进,标志着模型在智能化处理上的 ...
Kimi K2 的意义不止于又刷新了几个 benchmark。可以预料,随着开源社区在此基础上继续改进,2025 下半年将出现一批「比 K2 更会干活」的垂直智能体,真正把大模型从「聊天框」带进「生产线」。
近日,北京月之暗面科技有限公司(简称“月之暗面”)发布了其最新开源大模型Kimi K2,迅速引发全球关注。上线一周后,国际权威大模型排行榜LMArena宣布,Kimi ...
作者|子川来源|AI先锋官建议直接把“卷王”的称号直接焊在阿里千问团队的头上!昨天还在感叹Qwen3-235B-A22B登顶开源模型,没想到今天又放了个大招——Qwen3-Coder!相关阅读:重磅!阿里Qwen3超越Kimi-K2、DeepSeek ...
智东西7月22日报道,今天,月之暗面公布了其最新旗舰模型Kimi K2的完整技术报告。作为一款国产开源万亿参数大模型,Kimi K2在发布之后迅速爆火,并在大模型竞技场上接替新版DeepSeek-R1, 登顶全球开源模型榜首。
近日,北京月之暗面科技有限公司(简称“月之暗面”)正式发布了其最新的开源大模型Kimi K2,迅速引起全球科技界的广泛关注。上线仅一周,国际权威大模型排行榜LMArena宣布,Kimi ...
Kimi-K2使用名为MuonClip的新训练算法,在规模达到15.5万亿tokens的训练中保持稳定。该算法通过定期调整注意力机制中的关键参数,成功避免了大模型常见的“训练崩溃”问题。
Kimi K2 的意义不止于又刷新了几个 benchmark。可以预料,随着开源社区在此基础上继续改进,2025 下半年将出现一批「比 K2 更会干活」的垂直智能体,真正把大模型从「聊天框」带进「生产线」。
作为月之暗面 Infra侧推理方面研发人员,知乎答主刘少伟谈及了K2模型结构的设计宗旨。他称K2模型是在DeepSeek ...
在SWE-bench Verified这个被称为"AI编程能力终极考验"的基准测试中,Kimi K2拿下了65.8%的成绩。要知道,GPT-4.1在同一测试中只有54.6%,就连业界标杆Claude Sonnet 4也只是略微领先。
格隆汇7月25日丨 普元信息 ( 26.410, 0.49, 1.89%) (688118.SH)在互动平台表示,公司拥有成熟的大模型调用技术以及模型管理系统,可支持快速接入Kimi K2等各类主流大模型,并可系统化地积累业务场景特征与调优经验。未来,公司将依据客户业务场景的需求,积极探索人工智能大模型应用的落地实施。