ニュース

人们的抱怨之声依然不绝于耳,尤其是在模型能力提升方面。最近发布的两个备受瞩目的巨型模型,Grok 3和GPT-4.5,其能力相较于前代产品的提升非常有限。
这一次开源不仅是口头承诺。文心 4.5系列总共包括10个变体,从轻量级的3亿参数模型,到最多可激活47个专家、总参数达到4240亿的MoE模型应有尽有。
大模型竞技场秘密上线了一个叫steve的神秘模型,在对话中透露自己来自DeepSeek。 DeepSeek-R2,终于要来了? 大模型竞技场秘密上线了一个叫steve的神秘模型,在对话中透露自己来自DeepSeek。
有个差点就被骗到的Igor Zalutski小哥说,这个老哥看起来非常敏锐,而且不说废话,幸好周末做了背调,得知他不仅同时做很多工作、还谎报签证状态啥的。 Suhail ...
MIT和马德里理工大学这一研究论文已被《空间研究进展》(Journal of Advances in Space Research)接收,即将发表。 这是一类基于广受欢迎的《Kerbal Space Program》电子游戏的试验场,让研究社区在一个 ...
据了解,这是首次理论证明强化学习在 LLM 中的有效性。广泛实验验证了这一理论,表明这种内源性奖励不仅优于现有的 LLM-as-a-judge 方法,而且可以超越那些通过昂贵的人类标注数据显式训练的奖励模型的表现。
毕竟,以 Alpha 为结尾的命名方式不止一次传出是来自 OpenAI 的模型。比如此前 OpenRouter 上线的两款神秘模型 Optimus Alpha、Optimus Alpha 都被怀疑出自 OpenAI。因为它们的风格与 OpenAI ...
6月30日,Bloomberg爆出一个让整个科技圈都震惊的消息:苹果最核心的AI团队MLX,差点就这么没了。具体发生了什么?我花了一下午时间挖了挖这个事,发现这背后的故事比表面看起来要复杂得多。这不仅仅是一个普通的人才流失问题,而是关乎苹果能否在AI时代站稳脚跟的生死之战。
随着ChatGPT的一路走红,研究人员反而陷入困扰,面对GPU短缺、数据库连接耗尽、服务商速率限制导致的系统宕机,他们创建了“fail whale”页面,通过生成一首由GPT-3完成的诗歌自我调侃,提醒用户:我们宕机了!
事实上马斯克已经小范围这样试验过了,5月份,Grok在回答各种不相关的问题时都会随机提到“南非发生白人种族灭绝”的说法,并且承认自己被指示接受这个非真实发生的事件。 此次融资的参与者包括Valor Equity Partners 、Vy ...
我们在做的是非常通用的技术,它会被各种各样的人使用。和很多公司不同的是,别的公司通常从一个特定用户类型出发,用技术来解决这个群体的问题;而我们更多是从技术出发,观察谁能从中找到价值,然后再围绕这些用户进行迭代。
AI软件供应链正在迅速扩展,不仅包括开源开发工具,还涵盖了开发者共享定制模型、智能体、提示词及其他资源的协作平台。随着第三方AI组件和服务使用的增加,安全威胁也随之扩大——这种威胁在许多方面可能比传统软件供应链问题更为复杂、隐蔽且有害。