ニュース
AI软件供应链正在迅速扩展,不仅包括开源开发工具,还涵盖了开发者共享定制模型、智能体、提示词及其他资源的协作平台。随着第三方AI组件和服务使用的增加,安全威胁也随之扩大——这种威胁在许多方面可能比传统软件供应链问题更为复杂、隐蔽且有害。
研究人员也总结了4项关键发现:偏见驱动的合理化与动机性推理、隐性错误纠正(Silent Error Correction)、不忠实的非逻辑捷径(Unfaithful Illogical Shortcuts)、填充词元 (Filler Tokens)。
Grok 4 (grok-4-0629),则是一个更大、更智能的Thinking模型。官方宣称,这是他们最新、最强大的旗舰模型,在自然语言、数学和推理上性能无与伦比,是用户的最佳选择。 而Grok 4 ...
李飞飞:要总结过去五六年的经历真的很难,我们正生活在科技进步的这样一个文明时刻,对吧?而作为计算机视觉科学家,我们见证了计算机视觉从图像识别到图像描述再到使用扩散技术进行图像生成的惊人发展,这一切都在以一种非常令人兴奋的方式发生。
他们提出的AI专家智能体「ML-Master」,凭借着29.3%的平均奖牌率,拿下第一!大幅领先微软的RD-Agent(22.4%)和OpenAI展示的AIDE(16.9%)。
谁会第一个到达ASI?SemiAnalysis大佬Dylan Patel脱口而出:OpenAI!最近,这位圈内最懂AI和芯片的大佬,毫不留情地戳穿了GPT-4.5惨败的原因,还揭露了Meta仓促模仿DeepSeek结果大翻车的内幕。
一位高级工程师称,自己拿到Meta的年薪约仅为85万美元。根据Levels.FYI统计的数据,薪酬等级高于这位工程师的人(E7级别)平均年薪为154万美元。 就在今天,爆火AI编程神器Cursor还从Anthropic挖走了两人。一位是Claude ...
Cursor这次挖到了合作伙伴Anthropic的两名前核心高管:原“Claude Code”项目开发负责人Boris Cherny将出任首席架构师兼工程主管,原项目产品经理Cat Wu将担任产品负责人。 Boris Cherny ...
根据微软公布的测试数据显示,在与21名拥有超过10年从医经验的专业医生的测试对比中,人类医生在《新英格兰医学杂志》的56例隐藏测试集上的平均准确率仅为19.9%。 而MAI-DxO在无预算配置的情况下,使用OpenAI的o3模型时准确率高达81.9% ...
为了使 Computer-Use Agent(CUA)在未来能够大规模、安全地部署在实际应用场景中,来自上海 AI Lab、中国科学技术大学和上海交通大学的团队强势出手,推出 CUA 安全测试基准——RiOSWorld!称得上是 CUA ...
近期,我看到了OpenAI的创始人Sam ...
网络安全研究人员在人工智能公司Anthropic的Model Context Protocol(MCP,模型上下文协议)Inspector项目中发现了可导致远程代码执行(RCE)的高危漏洞,攻击者可借此完全控制开发者主机。该漏洞编号为CVE-2025 ...
一部の結果でアクセス不可の可能性があるため、非表示になっています。
アクセス不可の結果を表示する