|
|
AI 日报 · 2026.05.02
侧重 AI Coding & 具身智能
① OpenAI Codex重大更新:从代码助手进化为全能办公Agent
OpenAI发布Codex全面升级,拓展至日常办公场景。Computer Use模式速度提升20%(特定场景42%),新增基于岗位角色的动态UI,可连接Slack、Google Workspace、Microsoft 365等应用。CLI新增/goal跨轮次任务追踪,App新增/side侧边聊天。OpenAI内部人员称首次看到LLM操作GUI的速度与人类相当。
→ 关注原因:AI编程工具正向通用办公Agent进化,Claude Code vs Codex竞争白热化。
② Owl Alpha stealth模型上线OpenRouter:百万级上下文窗口
OpenRouter上线隐身模型Owl Alpha,专为Agent工作负载设计,提供百万级上下文窗口。原生支持工具调用和长链路任务,兼容Claude Code、OpenClaw等主流工具,在复杂代码工作流和自动化场景表现出色。
→ 关注原因:百万上下文+Agent原生设计,为长周期AI编程任务提供新基础设施。
③ Anthropic发布Claude Security测试版:AI安全审计新时代
基于Claude Opus 4.7,可扫描代码库漏洞、生成可审阅的修补建议(补丁需人工审批后应用)。支持按仓库/目录/分支设定扫描范围和定时扫描,结果可导出CSV/Markdown并推送至Slack、Jira,面向Claude Enterprise客户开放。
→ 关注原因:大模型从"写代码"迈向"审代码",AI安全审计进入实战阶段。
④ 中国具身智能五强商业化追踪:行业进入"交付落地"转折期
IT之家发布2026具身智能五大百亿级独角兽商业化进展:智平方(惠科3年1000台/5亿订单,7+行业落地)、银河通用(智慧零售"十城百店")、自变量机器人(真机数据闭环)、星海图("一脑多形"平台化)、千寻智能(18个月从原型到量产)。行业评估标准已从论文和融资转向订单规模和交付能力。
→ 关注原因:具身智能赛道从Demo经济转向交付经济,真实商业回款成为核心竞争力。
⑤ DeepSeek发布多模态技术报告:视觉原语思考代码
DeepSeek发布多模态技术报告,提出"视觉原语思考"方法,将视觉信息转化为代码形式进行推理。KV压缩比超7000倍,超越GPT-5.4表现。同期xAI推出Grok 4.3(知识截止2025.12),Gemini CLI更新v0.40.0支持本地模型与分层记忆。
→ 关注原因:DeepSeek多模态新思路将视觉理解转化为代码推理,为具身智能的视觉-动作链路提供新范式。
来源:综合公开报道 | 整理 by WorkBuddy AI |
|