【AI周报】3月第四周：国产大模型登顶全球、Claude新模型曝光、智能体元年宣告

duckwolf · 发表于 2026-3-29 09:26:25

AI 周报 · 2026 年第 13 周
2026.03.23 — 2026.03.29 | 本周 AI 世界发生了什么

一、本周最大事件：国产大模型全球调用量反超美国

本周最劲爆的消息来自 OpenRouter 数据平台——中国大模型 Token 调用量达 4.19 万亿，美国为 3.63 万亿，实现持续两周领先，历史性地完成全球调用量反超。

上榜国产前三名分别是：

MiniMax M2.5
DeepSeek V3.2
阶跃星辰 Step 3.5 Flash

值得注意的是，这批调用量中海外开发者占比高达 47%，说明国产大模型已经在全球开发者生态中真正站稳脚跟，不再只是国内自嗨。

阿里 Qwen3.5-Max-Preview 在国际盲测平台 LM Arena 以 1464 分登顶全球第一，超越 GPT-5.4、Claude 4.5 等海外旗舰模型。其采用的稀疏 MoE 架构（总参 397B，激活仅 17B）实现了高性能与低成本的完美平衡。

二、Claude 史上最强模型泄露：代号「卡皮巴拉」

本周 AI 圈最热门的话题之一，是 Anthropic 新旗舰模型 Claude Mythos（代号：卡皮巴拉）信息意外曝光。

性能据称完胜 Claude Opus 4.6，在推理、代码、多模态等方向全面提升
消息曝光后，美国网络安全概念股全线下跌（市场担忧 AI 能力过强冲击现有安全体系）
Anthropic 官方目前未公布正式发布时间，Claude Code Auto Mode 已先行上线

与此同时，Google Gemini 新增聊天记录导入功能（3月26日），允许用户从 ChatGPT、Claude 等其他 AI 助手导入历史对话和上下文，明摆着在抢用户。

三、博鳌论坛：2026 年是智能体 AI 元年

3 月 25 日，博鳌亚洲论坛"AI+"数智赋能产业升级分会上，中国工程院院士、清华大学教授张亚勤正式宣告：

今年是智能体 AI 元年。AI 正从生成式走向智能体，面向消费者的 Agent 应用出现爆发。

他提出的三大趋势：

从生成式 AI → 智能体 AI（Agent 接管任务执行）
从文字/图片 → 多模态感知与行动（视觉、语音、操控全打通）
从云端 → 端侧融合（手机、汽车、IoT 本地 AI 爆发）

论坛上另一个值得关注的声音：月之暗面创始人杨植麟 在 2026 中关村论坛上表示，"中国有全球最好的人才体系来孵化智能"，并系统阐述中国 AI 团队如何通过底层架构创新突围。

四、各家大模型本周动态速览

厂商/产品	动态
OpenAI GPT-5.4	百万 Token 上下文、原生电脑操作能力，推理编码全面升级
Google Gemini 3.1 Pro	百万 Token 长文本无衰减记忆；Veo 3 视频模型支持 10 分钟高保真生成
Meta Llama 4.0	70B 版本基准超越 GPT-4.5，完全开源无商用限制；另开源脑反应预测模型 TRIBE v2
DeepSeek V4	全面采用国产芯片（海光/寒武纪），彻底脱离 CUDA 生态，成本降 60%
小米 MiMo-V2	1.2 万亿参数，已落地手机/汽车端侧，投入 600 亿研发
华为盘古 2.0	具身智能驱动工业机械臂，定位精度误差 < 0.01mm
Suno v5.5	AI 音乐创作新增声音克隆和个人风格模仿，平民也能成唱作人
Claude Code	推出 Auto Mode，代码智能体可自主规划并执行多步任务

五、本周技术研究：RAG 神话正在破灭？

斯坦福顶尖研究团队发布重磅研究：合成数据训练（Synthetic Data Training）效果首次超越 RAG（检索增强生成），且成本大幅降低。

这意味着什么？

过去两年 RAG 是企业落地大模型的"标配方案"（把自己的文档库喂给模型检索），但斯坦福这项研究表明：用合成数据直接训练模型，比让模型"现查资料"更准确、更高效。这可能颠覆企业级 AI 应用的部署路径。

另一项有趣数据来自 Surfshark 报告：主流 AI 应用平均采集用户 14 项数据指标（共测试 35 项），隐私问题开始引发监管关注。

六、行业动向：AI 流量正在"偷走"互联网旧生意

一份数据让传统互联网坐不住了：AI 智能体流量增速是人类用户的 8 倍。以前人们刷新闻、点广告，现在越来越多的访问由 AI Agent 代劳——而 Agent 不看广告。

消费端同样出现变化：最新调查显示，三分之一的受访者愿意直接通过 ChatGPT 等 AI 平台购物，而不再访问零售商官网。电商的流量入口正在被 AI 重构。

另外，苹果 iOS 27 据报将允许 Claude、ChatGPT 等第三方 AI 与 Siri 集成，这或许意味着苹果终于认清：靠自己搞不出来，不如开放生态让强者进来。

七、安全与法律

AI 医疗风险警示：研究证明放射科医生已很难区分真实 X 光片与 AI 伪造图像（识别率仅 41%），医疗影像欺诈进入实际威胁阶段
版权诉讼升级：大英百科全书（Encyclopaedia Britannica）和韦氏词典（Merriam-Webster）相继起诉 OpenAI，指控训练数据侵权
律师翻车警示：多起律师因使用 AI 生成虚假法律引用被法院处罚，AI 在严肃专业场景仍需人工核查
安全测试赛道升温：AI 代理上线前测试公司 Galtea 完成 320 万美元融资，专注暴露 AI Agent 的幻觉、偏见和安全漏洞

本周一句话总结

国产大模型完成全球调用量历史性反超；Claude 史上最强模型即将登场；智能体元年已至，AI 正在从"会说话"进化为"会干活"。

本周报整理自猫目AI资讯、humai.blog、百度开发者中心、CSDN AtomGit等平台，时间范围 2026.03.23-03.29。内容仅供参考，请以各媒体原文为准。

		自动登录	找回密码
密码			立即注册