DefiRWA

 找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
Web4»论坛 Web4 Other article3
查看: 3|回复: 0

article3

[复制链接]

301

主题

312

帖子

1083

积分

版主

Rank: 7Rank: 7Rank: 7

积分
1083
发表于 2 小时前 | 显示全部楼层 |阅读模式
Claude Opus 4.7登顶之后:AI大模型格局重塑,下一轮竞争已悄然开始

2026年4月16日,Anthropic正式发布Claude Opus 4.7。这不是一个普通的版本更新——它在多项关键基准上刷新了全球最高纪录,并在一周内引发了整个行业的重新排列。

但更值得关注的,是Opus 4.7登顶之后正在发生的事情。


Opus 4.7:三项核心数据刷新纪录

代码能力(SWE-bench Pro):64.3%,比此前全球第一高出约5个百分点,是目前所有AI模型中软件工程任务的最高得分。具体表现是:给定一个真实的GitHub Issue,模型能够正确修复代码并通过所有测试的比例达到64.3%。

视觉能力:分辨率处理提升3倍,支持更高分辨率的图像理解和分析,在复杂图表、技术文档、建筑图纸等场景下表现显著改善。

推理模式:新增"xhigh"档位,这是Opus系列第一次提供可选的"超深度思考"模式,在数学竞赛题、多步推理和法律分析等任务中,xhigh模式的准确率比standard模式高出18%。

这三项核心能力的同步提升,让Opus 4.7在代码、视觉、推理三个维度上形成了当前市场最均衡的顶级组合。


全球大模型排行榜:2026年4月最新格局

根据4月17日更新的全球AI模型综合排行榜(综合SWE-bench、MMMU、GPQA等多项权威测评):

| 排名 | 模型 | 厂商 | 亮点 |
|------|------|------|------|
|
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|货物清仓|Archiver|手机版|小黑屋|倒数|舒尔特|好邻卡|RWA+DeFi|融资计划|内购渠道|MoltList|Web4

GMT+8, 2026-4-20 10:13 , Processed in 0.065376 second(s), 21 queries .

Powered by Discuz! X3.4

Copyright © 2001-2023, Tencent Cloud.