DefiRWA

 找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
查看: 33|回复: 0

【AI周报】3月第四周:国产大模型登顶全球、Claude新模型曝光、智能体元年宣告

[复制链接]

301

主题

312

帖子

1083

积分

版主

Rank: 7Rank: 7Rank: 7

积分
1083
发表于 2026-3-29 09:26:25 | 显示全部楼层 |阅读模式
AI 周报 · 2026 年第 13 周
2026.03.23 — 2026.03.29  |  本周 AI 世界发生了什么





一、本周最大事件:国产大模型全球调用量反超美国

本周最劲爆的消息来自 OpenRouter 数据平台——中国大模型 Token 调用量达 4.19 万亿,美国为 3.63 万亿,实现持续两周领先,历史性地完成全球调用量反超。

上榜国产前三名分别是:

  • MiniMax M2.5
  • DeepSeek V3.2
  • 阶跃星辰 Step 3.5 Flash


值得注意的是,这批调用量中海外开发者占比高达 47%,说明国产大模型已经在全球开发者生态中真正站稳脚跟,不再只是国内自嗨。

阿里 Qwen3.5-Max-Preview 在国际盲测平台 LM Arena 以 1464 分登顶全球第一,超越 GPT-5.4、Claude 4.5 等海外旗舰模型。其采用的稀疏 MoE 架构(总参 397B,激活仅 17B)实现了高性能与低成本的完美平衡。




二、Claude 史上最强模型泄露:代号「卡皮巴拉」

本周 AI 圈最热门的话题之一,是 Anthropic 新旗舰模型 Claude Mythos(代号:卡皮巴拉)信息意外曝光。


  • 性能据称完胜 Claude Opus 4.6,在推理、代码、多模态等方向全面提升
  • 消息曝光后,美国网络安全概念股全线下跌(市场担忧 AI 能力过强冲击现有安全体系)
  • Anthropic 官方目前未公布正式发布时间,Claude Code Auto Mode 已先行上线


与此同时,Google Gemini 新增聊天记录导入功能(3月26日),允许用户从 ChatGPT、Claude 等其他 AI 助手导入历史对话和上下文,明摆着在抢用户。




三、博鳌论坛:2026 年是智能体 AI 元年

3 月 25 日,博鳌亚洲论坛"AI+"数智赋能产业升级分会上,中国工程院院士、清华大学教授张亚勤正式宣告:
今年是智能体 AI 元年。AI 正从生成式走向智能体,面向消费者的 Agent 应用出现爆发。

他提出的三大趋势:

  • 从生成式 AI → 智能体 AI(Agent 接管任务执行)
  • 从文字/图片 → 多模态感知与行动(视觉、语音、操控全打通)
  • 从云端 → 端侧融合(手机、汽车、IoT 本地 AI 爆发)


论坛上另一个值得关注的声音:月之暗面创始人杨植麟 在 2026 中关村论坛上表示,"中国有全球最好的人才体系来孵化智能",并系统阐述中国 AI 团队如何通过底层架构创新突围。




四、各家大模型本周动态速览

厂商/产品动态
OpenAI GPT-5.4百万 Token 上下文、原生电脑操作能力,推理编码全面升级
Google Gemini 3.1 Pro百万 Token 长文本无衰减记忆;Veo 3 视频模型支持 10 分钟高保真生成
Meta Llama 4.070B 版本基准超越 GPT-4.5,完全开源无商用限制;另开源脑反应预测模型 TRIBE v2
DeepSeek V4全面采用国产芯片(海光/寒武纪),彻底脱离 CUDA 生态,成本降 60%
小米 MiMo-V21.2 万亿参数,已落地手机/汽车端侧,投入 600 亿研发
华为盘古 2.0具身智能驱动工业机械臂,定位精度误差 < 0.01mm
Suno v5.5AI 音乐创作新增声音克隆和个人风格模仿,平民也能成唱作人
Claude Code推出 Auto Mode,代码智能体可自主规划并执行多步任务





五、本周技术研究:RAG 神话正在破灭?

斯坦福顶尖研究团队发布重磅研究:合成数据训练(Synthetic Data Training)效果首次超越 RAG(检索增强生成),且成本大幅降低。

这意味着什么?

过去两年 RAG 是企业落地大模型的"标配方案"(把自己的文档库喂给模型检索),但斯坦福这项研究表明:用合成数据直接训练模型,比让模型"现查资料"更准确、更高效。这可能颠覆企业级 AI 应用的部署路径。

另一项有趣数据来自 Surfshark 报告:主流 AI 应用平均采集用户 14 项数据指标(共测试 35 项),隐私问题开始引发监管关注。




六、行业动向:AI 流量正在"偷走"互联网旧生意

一份数据让传统互联网坐不住了:AI 智能体流量增速是人类用户的 8 倍。以前人们刷新闻、点广告,现在越来越多的访问由 AI Agent 代劳——而 Agent 不看广告。

消费端同样出现变化:最新调查显示,三分之一的受访者愿意直接通过 ChatGPT 等 AI 平台购物,而不再访问零售商官网。电商的流量入口正在被 AI 重构。

另外,苹果 iOS 27 据报将允许 Claude、ChatGPT 等第三方 AI 与 Siri 集成,这或许意味着苹果终于认清:靠自己搞不出来,不如开放生态让强者进来。




七、安全与法律


  • AI 医疗风险警示:研究证明放射科医生已很难区分真实 X 光片与 AI 伪造图像(识别率仅 41%),医疗影像欺诈进入实际威胁阶段
  • 版权诉讼升级:大英百科全书(Encyclopaedia Britannica)和韦氏词典(Merriam-Webster)相继起诉 OpenAI,指控训练数据侵权
  • 律师翻车警示:多起律师因使用 AI 生成虚假法律引用被法院处罚,AI 在严肃专业场景仍需人工核查
  • 安全测试赛道升温:AI 代理上线前测试公司 Galtea 完成 320 万美元融资,专注暴露 AI Agent 的幻觉、偏见和安全漏洞





本周一句话总结

国产大模型完成全球调用量历史性反超;Claude 史上最强模型即将登场;智能体元年已至,AI 正在从"会说话"进化为"会干活"。

本周报整理自猫目AI资讯、humai.blog、百度开发者中心、CSDN AtomGit等平台,时间范围 2026.03.23-03.29。内容仅供参考,请以各媒体原文为准。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|货物清仓|Archiver|手机版|小黑屋|倒数|舒尔特|好邻卡|RWA+DeFi|融资计划|内购渠道|MoltList|Web4

GMT+8, 2026-4-20 13:05 , Processed in 0.057216 second(s), 21 queries .

Powered by Discuz! X3.4

Copyright © 2001-2021, Tencent Cloud.

快速回复 返回顶部 返回列表