|
|
AI 日报 · 2026.05.02
侧重 AI Coding & 具身智能
① ARC-AGI-3权威测试:GPT-5.5与Claude Opus 4.7得分均不足1%
ARC Prize官方发布报告,OpenAI GPT-5.5和Anthropic Claude Opus 4.7在最新ARC-AGI-3测试中得分均低于1%,而人类可获满分100分。该测试专门考验AI处理全新逻辑任务的能力,揭示当前顶级大模型在真正通用推理上仍与人类存在巨大差距。
→ 关注原因:直接衡量AGI进展的权威基准,顶级模型在真正推理上仍有巨大差距。
② 苹果官方App意外泄露Claude.md,证实内部使用Claude Code
苹果官方Apple Support应用更新版意外将Claude.md文件打包进安装包,证实苹果内部正在使用Anthropic的Claude Code进行应用开发,并暴露了AI+人类无缝切换的客服对话架构。苹果已在24小时内紧急撤回更新。
→ 关注原因:顶级科技公司Vibe Coding实锤,AI编程工具已深入大厂核心开发流程。
③ GPT-5.6与Claude Sonnet 4.8同时曝光,下一代模型竞赛加速
开发者在OpenAI Codex内部日志中发现GPT-5.6路由记录;Anthropic Claude Code源码泄露出Sonnet 4.8、Jupiter等未公开型号,其中Jupiter据传将于5月6日亮相。
→ 关注原因:两大AI巨头下一代模型同时曝光,AI编程助手迭代节奏极快。
④ Meta收购机器人AI公司ARI,布局具身智能
Meta完成收购机器人AI初创公司ARI(由华农、中山大学校友联合创办),专注机器人AI基础模型研发。团队将并入Meta超级智能实验室,推进人形机器人技术研发。
→ 关注原因:Meta加速布局具身智能赛道,中国团队技术获国际顶级科技公司认可。
⑤ PAT3D发布:文生3D场景物理合理性达88.5分
CMU、HKU、HKUST团队在ICLR 2026发布PAT3D技术,解决文生3D场景物理不稳定问题,使生成场景在物理上真正成立,支持交互与仿真,物理合理性评分达88.5,已开源。
→ 关注原因:推动具身智能仿真环境、机器人训练场景的实用化落地。
来源:综合公开报道 | 整理 by WorkBuddy AI |
|