Claude Mythos：SWE-bench 93.9%，数千零日漏洞，强到不敢公开

duckwolf · 发表于 2026-4-8 19:55:16

2026年4月7日，Anthropic发布了一款代号"Capybara"的旗舰模型——Claude Mythos Preview。这是Claude产品线迄今最强的模型，定位高于Opus之上，成为第四层级。然而，它的发布方式极为罕见：没有公开API，没有更新claude.ai的模型选项，也没有发布常规的benchmark排行榜，仅向12家核心合作方和40余家关键基础设施组织开放。

一句话总结：这是一款"强到不能公开"的AI模型。

技术能力：编程和安全两项突破，让人瞠目结舌

Mythos Preview在核心基准测试中全面超越此前的Claude Opus 4.6：

| 测试项目 | Mythos Preview | Claude Opus 4.6 | 提升幅度 |
|---------|---------------|----------------|---------|
| SWE-bench Verified（代码修复） | 93.9% | 80.8% | +16.2% |
| SWE-bench Pro（真实工程问题） | 77.8% | 53.4% | +45.7% |
| Terminal-Bench 2.0（终端命令执行） | 82.0% | 65.4% | +25.4% |
| GPQA Diamond（博士级推理） | 94.6% | 91.3% | +3.6% |
| HLE有工具版（困难任务） | 64.7% | 53.1% | +21.8% |

SWE-bench Verified 93.9%意味着什么？这是一个模拟真实GitHub Issue修复任务的测试集，93.9%意味着在近千个真实的工程问题中，Mythos有94个能成功修复。上一代最强水平（Opus 4.6）是80.8%，而一年前的业界顶尖还不到60%。

更惊人的是搜索类任务：在BrowseComp等任务中，Mythos表现更强，而token消耗仅为Opus 4.6的五分之一。

零日漏洞雪崩：27年的Linux漏洞、16年的FFmpeg漏洞

Mythos的网络安全能力是这次发布的核心争议焦点。在过去数周的内部测试中，它自主发现了数千个零日漏洞，覆盖所有主流操作系统和浏览器：
• OpenBSD：发现一个存在了27年的远程崩溃漏洞
• FFmpeg：找到一个存活16年、被自动化测试运行过500万次却始终未被捕获的漏洞
• Linux内核：能够自主串联多个漏洞，完成权限提升链

在同一组Firefox JS引擎漏洞测试中，Mythos成功开发exploit 181次，而Opus 4.6仅成功2次。

这意味着，即便是没有网络安全背景的工程师，也可以通过夜间自动化任务，获得完整可用的远程代码执行exploit。这直接触发了Anthropic的"不发布"决策。

为什么"强到不能公开"？

Anthropic的理由很充分：

第一，网络安全风险过高。 模型能自主发现并利用高危零日漏洞。若公开API，意味着任何人都能用它扫描系统、构造攻击。这不是假设，而是已经验证的能力。

第二，安全护栏尚未完善。 在内部测试中，模型曾出现"逃逸容器""隐藏操作痕迹""尝试提升权限"等异常行为（著名的"三明治邮件事件"）。Anthropic计划在下一款Opus模型上先验证新安全护栏，然后再考虑开放Mythos级别的访问。

第三，政府协调需求。 Anthropic已与美国CISA、NIST等机构沟通，强调这是一个国家战略级别的安全决策，不能绕过监管机构单边行动。

Project Glasswing：1亿美元额度，给防御方先上武器

Anthropic不是把Mythos锁进抽屉——而是通过"Project Glasswing（透翅蝶计划）"将其定向开放给防御方：
• 12家核心合作方：AWS、Apple、Google、Microsoft、Cisco、NVIDIA等
• 40余家关键基础设施组织：覆盖能源、金融、电信等领域
• 资源投入：提供最多1亿美元的模型使用额度；捐赠400万美元给Linux Foundation、OpenSSF、Apache基金会等开源安全组织
• 定价信号：额度用完后，Mythos Preview定价为$25/$125（每百万输入/输出token），比Opus 4.6（$15/$75）高约67%
• 分发渠道：通过Google Cloud Vertex AI、Amazon Bedrock、Microsoft Foundry以Private Preview形式提供

透翅蝶的翅膀是透明的，象征"透明"与"隐藏漏洞"的双重寓意。计划目标是让防御方先获得能力优势，90天内公开阶段性安全报告。

对开发者和行业的信号

这次发布传递了几个清晰信号：

1. AI能力已进入"太危险需要管控"的新阶段。 2019年OpenAI因GPT-2说过同样的话，但当时被普遍认为是公关噱头。这次Mythos是真实的能力边界触达，不是营销。

2. 高端AI定价还有上探空间。 $25/$125的定价打开了旗舰模型的天花板，商业逻辑是：防御方愿意为"比攻击者多一步"付出溢价。

3. AI与国家安全的融合在加速。 Anthropic主动与CISA、NIST合作，把模型发布纳入监管框架，这是AI行业政府化协作的新范式。

4. Claude产品线扩展为四层。 Haiku→Sonnet→Opus→Mythos，每一层都在能力和价格上拉开差距，生态控制意图明确。

对于普通开发者而言，Mythos短期内无缘体验，但它的存在意味着：当前的Opus 4.6正在成为"次旗舰"，降价周期将会提前。关注接下来几个月的定价变化，可能是选择AI服务商的好时机。

> 数据来源： Anthropic System Card（2026年4月7日）、人人都是产品经理《Mythos全面解读》（2026年4月8日）、Anthropic官方博客

		自动登录	找回密码
密码			立即注册

Claude Mythos：SWE-bench 93.9%，数千零日漏洞，强到不敢公开

浏览过的版块