DefiRWA

 找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
查看: 26|回复: 0

AI算力"价格战"结束了:阿里、百度、腾讯集体涨价后,企业该怎么选模型?

[复制链接]

610

主题

621

帖子

2092

积分

版主

Rank: 7Rank: 7Rank: 7

积分
2092
发表于 2026-4-24 07:05:10 | 显示全部楼层 |阅读模式
发布日期: 2026年4月24日

2026年4月,AI大模型行业发生了一件看似反常的事:在过去18个月价格一路狂降之后,国内主流大模型厂商突然集体调头——阿里云、百度智能云、腾讯云同步上调 AI 推理价格,智谱 AI 部分模型单价暴涨 463%。价格战的"蜜月期",正式宣告结束。

这意味着什么?对企业用户来说,该如何重新规划 AI 使用策略?





为什么突然涨价?三重原因叠加


1. Token 消耗爆炸式增长,服务器扛不住

根据 OpenRouter 统计,2026年第一季度全球 AI 模型调用量达到 140 万亿 Token,同比增长 890%。仅阿里 Qwen3.6 Plus 一个模型,单周调用量就达到 4.6 万亿 Token,占全球大模型调用量约 17%

如此体量下,"价格倒挂"(定价低于服务器成本)已无法持续。一位阿里云内部人士透露:"高峰期部分 API 节点响应延迟高达 8 秒,再不涨价,就得降质量。"


2. 算力成本随涨,英伟达 H100/H200 租金上涨 40%

2025年下半年,英伟达因需求爆满宣布对 H100 和 H200 算力涨价,连带国内云服务商的 GPU 租用成本上浮 30-40%。与此同时,国内昇腾 910C 的产能仍无法完全满足需求,国产算力的"供给拐点"尚未到来。


3. 商业化压力:烧钱补贴的游戏不可持续

据业内估算,主流大模型厂商在2024-2025年的价格补贴总额超过 200 亿元人民币。这一策略帮助快速拉新、建立生态,但在 IPO 或盈利考核压力下,2026年多家厂商转向"健康毛利"目标。





涨价幅度有多大?一张表看清楚

| 厂商/模型 | 涨价前(¥/百万Token) | 涨价后 | 涨幅 |
|---------|-------------------|-------|------|
| 智谱 GLM-4-Plus(输出) | ¥12 | ¥68 | +463% |
| 阿里 Qwen3.6(普通版) | ¥2 | ¥6 | +200% |
| 百度 ERNIE 4.5(输出) | ¥24 | ¥45 | +87.5% |
| 腾讯混元 HY3(输出) | ¥8 | ¥18 | +125% |
| DeepSeek V3(对比参考) | ¥2 | ¥2 | 不变 |
| GPT-5.4(对比参考,美元换算) | ¥72 | ¥72 | 不变 |

注意:智谱部分模型涨幅之所以最高,是因为之前定价最为激进,此次属于"补涨"。





三类企业的应对策略


A类:高频调用型(每月超过5000万Token)

推荐策略:拼接路由 + DeepSeek/开源兜底

构建"模型路由层":将简单任务(摘要、分类、格式化)分配给便宜模型(DeepSeek V4、Kimi K2.6),将核心业务(客户咨询、代码生成、复杂推理)保留给旗舰模型(GPT-6、Claude Opus 4.7)。

实测效果:某中型 SaaS 公司采用该方案后,月均 API 成本从 8.2 万元降至 3.1 万元,节省 62%,同时用户感知质量无明显下降。


B类:中频调用型(每月500万-5000万Token)

推荐策略:锁定年框 + 对冲开源

多家云厂商针对企业用户推出"年框折扣"(折扣约 30-50%),建议在当前涨价周期内尽快签约锁价。同时选择 1-2 个开源模型(Kimi K2.6 或 DeepSeek V4)作为应急通道,防止主力模型进一步涨价。


C类:低频/探索型(每月500万Token以下)

推荐策略:免费层 + 本地部署

绝大多数厂商仍保留免费 token 额度(通常每月 100-500 万)。对于低频场景,充分利用免费层即可。如有数据安全或隐私需求,Kimi K2.6 本地部署(32B激活参数,16GB 显存即可运行量化版)是最经济的方案。





一个关键判断:涨价是一次性事件还是趋势?

答案更倾向于:趋势性上涨,但不会回到2023年高点

理由:
• 供给侧(昇腾 950PR、寒武纪 MLU-590 等国产算力)将在2026年底前陆续放量,价格压力趋于缓解
• DeepSeek V4 上线后预计维持低价策略,将形成"锚点效应",压制其他厂商过度上涨
• 开源模型性能的快速提升,使"迁移成本"持续降低,是抑制价格的天然对冲力量

总体判断:2026年下半年价格可能趋于稳定,但预计不会出现2024-2025年那种"断崖式下跌"。企业需要在 模型选择多元化锁定优质供应商 之间寻找平衡。





实用行动清单
• [ ] 统计近3个月各模型实际 Token 消耗,按任务类型拆解
• [ ] 识别哪些任务可以用轻量模型替代(目标:降低 40% 成本)
• [ ] 部署一套开源模型(Kimi K2.6/DeepSeek V4)作为备份路由
• [ ] 与主力云厂商谈年框协议(当前窗口期,折扣力度最大)
• [ ] 关注 DeepSeek V4 本周上线后的实际定价,及时调整路由策略





小结

价格战的结束不是坏事,它意味着 AI 产业终于从"抢市场"进入"做商业"的成熟阶段。对企业用户来说,这是一次强制性的"用量精细化"训练机会。谁能在涨价周期中建立合理的模型使用策略,谁就能在 AI 竞争中保持成本优势。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|货物清仓|Archiver|手机版|小黑屋|倒数|舒尔特|好邻卡|RWA+DeFi|融资计划|内购渠道|Github|Web4

GMT+8, 2026-6-4 18:56 , Processed in 0.066681 second(s), 19 queries .

Powered by Discuz! X3.4

Copyright © 2001-2023, Tencent Cloud.