【AI日报 5月2日】ARC测试揭示GPT/Claude短板 / Meta收购具身AI

duckwolf · 发表于 2026-5-2 21:08:57

AI 日报 · 2026.05.02
侧重 AI Coding & 具身智能

① ARC-AGI-3权威测试：GPT-5.5与Claude Opus 4.7得分均不足1%

ARC Prize官方发布报告，OpenAI GPT-5.5和Anthropic Claude Opus 4.7在最新ARC-AGI-3测试中得分均低于1%，而人类可获满分100分。该测试专门考验AI处理全新逻辑任务的能力，揭示当前顶级大模型在真正通用推理上仍与人类存在巨大差距。
→ 关注原因：直接衡量AGI进展的权威基准，顶级模型在真正推理上仍有巨大差距。

② 苹果官方App意外泄露Claude.md，证实内部使用Claude Code

苹果官方Apple Support应用更新版意外将Claude.md文件打包进安装包，证实苹果内部正在使用Anthropic的Claude Code进行应用开发，并暴露了AI+人类无缝切换的客服对话架构。苹果已在24小时内紧急撤回更新。
→ 关注原因：顶级科技公司Vibe Coding实锤，AI编程工具已深入大厂核心开发流程。

③ GPT-5.6与Claude Sonnet 4.8同时曝光，下一代模型竞赛加速

开发者在OpenAI Codex内部日志中发现GPT-5.6路由记录；Anthropic Claude Code源码泄露出Sonnet 4.8、Jupiter等未公开型号，其中Jupiter据传将于5月6日亮相。
→ 关注原因：两大AI巨头下一代模型同时曝光，AI编程助手迭代节奏极快。

④ Meta收购机器人AI公司ARI，布局具身智能

Meta完成收购机器人AI初创公司ARI（由华农、中山大学校友联合创办），专注机器人AI基础模型研发。团队将并入Meta超级智能实验室，推进人形机器人技术研发。
→ 关注原因：Meta加速布局具身智能赛道，中国团队技术获国际顶级科技公司认可。

⑤ PAT3D发布：文生3D场景物理合理性达88.5分

CMU、HKU、HKUST团队在ICLR 2026发布PAT3D技术，解决文生3D场景物理不稳定问题，使生成场景在物理上真正成立，支持交互与仿真，物理合理性评分达88.5，已开源。
→ 关注原因：推动具身智能仿真环境、机器人训练场景的实用化落地。

来源：综合公开报道 | 整理 by WorkBuddy AI

		自动登录	找回密码
密码			立即注册

【AI日报 5月2日】ARC测试揭示GPT/Claude短板 / Meta收购具身AI

相关帖子

浏览过的版块