News

有个差点就被骗到的Igor Zalutski小哥说,这个老哥看起来非常敏锐,而且不说废话,幸好周末做了背调,得知他不仅同时做很多工作、还谎报签证状态啥的。 Suhail ...
MIT和马德里理工大学这一研究论文已被《空间研究进展》(Journal of Advances in Space Research)接收,即将发表。 这是一类基于广受欢迎的《Kerbal Space Program》电子游戏的试验场,让研究社区在一个 ...
随着ChatGPT的一路走红,研究人员反而陷入困扰,面对GPU短缺、数据库连接耗尽、服务商速率限制导致的系统宕机,他们创建了“fail whale”页面,通过生成一首由GPT-3完成的诗歌自我调侃,提醒用户:我们宕机了!
事实上马斯克已经小范围这样试验过了,5月份,Grok在回答各种不相关的问题时都会随机提到“南非发生白人种族灭绝”的说法,并且承认自己被指示接受这个非真实发生的事件。 此次融资的参与者包括Valor Equity Partners 、Vy ...
毕竟,以 Alpha 为结尾的命名方式不止一次传出是来自 OpenAI 的模型。比如此前 OpenRouter 上线的两款神秘模型 Optimus Alpha、Optimus Alpha 都被怀疑出自 OpenAI。因为它们的风格与 OpenAI ...
研究人员也总结了4项关键发现:偏见驱动的合理化与动机性推理、隐性错误纠正(Silent Error Correction)、不忠实的非逻辑捷径(Unfaithful Illogical Shortcuts)、填充词元 (Filler Tokens)。
AI软件供应链正在迅速扩展,不仅包括开源开发工具,还涵盖了开发者共享定制模型、智能体、提示词及其他资源的协作平台。随着第三方AI组件和服务使用的增加,安全威胁也随之扩大——这种威胁在许多方面可能比传统软件供应链问题更为复杂、隐蔽且有害。
研究人员解释说:“在我们的实验中,模型经过微调以输出不安全的代码,但不对用户公开这一点。” “由此产生的模型在一系列与编码无关的提示上表现出不一致的行为:它断言人类应该被 AI ...
李飞飞:要总结过去五六年的经历真的很难,我们正生活在科技进步的这样一个文明时刻,对吧?而作为计算机视觉科学家,我们见证了计算机视觉从图像识别到图像描述再到使用扩散技术进行图像生成的惊人发展,这一切都在以一种非常令人兴奋的方式发生。
据了解,这是首次理论证明强化学习在 LLM 中的有效性。广泛实验验证了这一理论,表明这种内源性奖励不仅优于现有的 LLM-as-a-judge 方法,而且可以超越那些通过昂贵的人类标注数据显式训练的奖励模型的表现。
6月30日,Bloomberg爆出一个让整个科技圈都震惊的消息:苹果最核心的AI团队MLX,差点就这么没了。具体发生了什么?我花了一下午时间挖了挖这个事,发现这背后的故事比表面看起来要复杂得多。这不仅仅是一个普通的人才流失问题,而是关乎苹果能否在AI时代站稳脚跟的生死之战。
我们在做的是非常通用的技术,它会被各种各样的人使用。和很多公司不同的是,别的公司通常从一个特定用户类型出发,用技术来解决这个群体的问题;而我们更多是从技术出发,观察谁能从中找到价值,然后再围绕这些用户进行迭代。