DefiRWA

 找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
查看: 26|回复: 0

AI推理成本3年跌280倍:算力通胀来了,普通企业如何应对?

[复制链接]

610

主题

621

帖子

2092

积分

版主

Rank: 7Rank: 7Rank: 7

积分
2092
发表于 2026-4-23 07:23:58 | 显示全部楼层 |阅读模式
斯坦福HAI的《2026年AI指数报告》写了一组让人瞠目的数据:AI推理成本在过去3年内下跌了280倍。同一个任务,2023年要花100元,2026年只需0.36元。

然而就在这个节点,国内主要云厂商集体宣布上调AI算力价格。阿里云、百度智能云、腾讯云同步涨价;智谱两个月内3次调价,部分模型涨幅高达463%

这不是矛盾,这是市场周期。





为什么算力先跌后涨?


第一阶段(2023-2025):烧钱抢市场

大模型训练完成后,推理服务的边际成本很低。OpenAI、Anthropic、阿里、百度在这一阶段打的是"用户粘性争夺战"——以低于成本的价格获客,用VC输血维持运营。

这是真正的价格战:
• 2023年,GPT-4 API输入价格约:$30/百万Token
• 2025年,主流大模型输入价格降至:$0.1-1/百万Token
• 降幅:30-300倍


第二阶段(2026年起):终结价格倒挂

"规模效应"在推理端没有想象中大。大模型的计算需求随用户增长线性扩张,GPU采购价格因全球算力供应紧张持续上涨(英伟达H200/B200供货紧张),加上电费、运维、带宽等固定成本,多数厂商的AI推理业务长期处于亏损状态。

2026年Q1,几乎同时出现了转折信号:
国内:阿里云、百度、腾讯、智谱相继上调定价,智谱GLM-4-Plus涨幅达463%
国际:Anthropic悄悄上调Claude API价格,OpenAI推出"增效版"和"基础版"分层定价

价格倒挂时代结束了。





国内主要大模型API最新定价对比

| 模型 | 输入(元/百万Token) | 输出(元/百万Token) | 涨价幅度 |
|------|---------------------|---------------------|---------|
| Qwen3.6 Plus | 0.7 | 2.1 | 未涨 |
| DeepSeek V4(预期) | ~2.0 | ~8.0 | 新品 |
| 文心4.0 | 4.0 | 12.0 | +约30% |
| GLM-5.1 | 3.5 | 10.5 | +约463%* |
| Kimi K2.6 | 2.0 | 6.0 | 新品 |
| Claude Opus 4.7(国内合规版) | 约18 | 约54 | +约15% |

*注:GLM涨价指的是旧版GLM-4-Plus,新版GLM-5.1为新定价体系





算力通胀对企业意味着什么?


影响一:AI应用的成本结构重新洗牌

过去两年,很多SaaS公司用"免费AI功能"来吸引用户。随着API成本上涨,这些公司将面临两个选择:
1. 涨价或调整套餐,把成本转嫁给用户
2. 压缩调用量,对非核心功能限制AI使用

国内一家HR SaaS上市公司在Q1财报中披露,AI相关成本季度环比增长47%。


影响二:模型选型策略变得更重要

以前用最贵的模型是一种"技术自信",现在是一种"成本失控"的信号。

推荐的分层选型策略
轻量任务(分类、提取、简单总结)→ 用小模型(Qwen3.6-7B、Kimi-Flash)
• 成本:约0.02-0.1元/百万Token
标准任务(多轮对话、代码辅助、文案生成)→ 用中端模型(Qwen3.6 Plus)
• 成本:约0.7-3元/百万Token  
复杂任务(深度推理、长文档分析、多步骤Agent)→ 用旗舰模型(Kimi K2.6、GLM-5.1)
• 成本:约2-10元/百万Token
离线/私密任务(不愿上云)→ 私有化部署GLM-5.1(32GB显存可跑)


影响三:国产模型的护城河更深了

高涨的算力成本,恰好是国产模型的相对优势窗口。当Claude Opus 4.7的输出价格是Qwen3.6 Plus的25倍时,"95%场景用国产,5%顶尖任务用国际"的混合策略成为理性选择。





实操建议:三步控制AI成本

第一步:审计现有调用量
用云厂商后台的Token消耗看板,找出前5个消耗最高的场景,往往20%的功能消耗了80%的成本。

第二步:引入Prompt缓存
OpenAI、Anthropic、阿里云均已支持Prompt Caching,对重复的系统提示和长上下文文档,缓存命中可节省50-90%的输入Token费用。

第三步:建立成本告警机制
设置每日/每周的Token消耗上限,超出阈值自动降级到更便宜的模型,防止某个失控的循环调用把月账单打爆。





结语

算力通胀不是坏消息,是市场走向成熟的信号。真正有价值的AI应用,完全可以承受正常定价;靠价格战维系的"伪需求",本来就不该存在。

对大多数中小企业来说,AI成本上涨的压力,反而是一个审视"我们到底用AI做了什么有价值的事"的好机会。

> 数据来源:斯坦福HAI《2026年AI指数报告》、阿里云通义开放平台、智谱开放平台、新浪AI、The Information(算力成本分析)
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|货物清仓|Archiver|手机版|小黑屋|倒数|舒尔特|好邻卡|RWA+DeFi|融资计划|内购渠道|Github|Web4

GMT+8, 2026-6-4 17:44 , Processed in 0.063520 second(s), 20 queries .

Powered by Discuz! X3.4

Copyright © 2001-2023, Tencent Cloud.