热搜词: 2025 2026

Tokens经济崛起: IDC报告揭示AI应用新风向, 火山引擎领跑市场

9月19日,国际数据公司(IDC)发布了一份名为《中国大模型公有云服务市场分析,2025H1》的调研报告,其中披露了当前中国AI产业发展速度的核心数据,值得关注。

报告显示,2025年上半年,中国公有云上大模型调用量(统计口径为云厂商对外部客户提供的服务,不含自有业务)达536.7万亿Tokens,较2024年全年114万亿Tokens的规模增长近400%。

市场格局方面,火山引擎以49.2%的份额位居第一,接近半壁江山,延续并扩大了2024年46.4%的领先优势。阿里云百炼平台则以27.0%的市场占比排名第二,第三是百度智能院千帆平台,占比17.0%。

IDC在报告中同时指出,中国大模型公有云服务市场未来仍有数百倍增长空间,但当前面临的核心瓶颈是如何打破泛互联网行业局限,向更多传统行业渗透;此外,市场已从侧重模型训练显著向模型推理服务迁移,多模态大模型与Agent应用成为增长关键驱动力,并建议行业需从“量”向“质”突破,以应用生态塑造差异化,同时推动低码与高码开发模式融合。

两大增长拐点揭示行业逻辑:为何Token成AI应用核心标尺?

仔细看IDC的报告,可以发现一些有意思的现象。比如在报告中关于“中国公有云大模型调用量月度环比增长”的统计曲线中,能够清晰发现两个改变行业增长格局的关键拐点,而这两个节点背后,恰好是Token成为AI应用核心衡量指标的深层逻辑所在。

第一个拐点是2024年7月,这个月的中国大模型公有云服务YoY增长率超过160%。而这个时间点,恰好是豆包大模型技术降本全面发酵之后。在这之前的2024年5月15日,豆包大模型通过模型架构、推理框架等技术创新,将主力模型定价直接从行业的“分计价”拉入“厘计价”时代,降幅高达99.3%。

第二个拐点出现在2025年2月,这个月的增长幅度达到60%的水平。而这个时间点,对应的是行业事件是DeepSeek-R1推理模型爆红。

这一事件不仅加速了MaaS市场渗透率,更标志着中国AI云市场正式从“预训练时代”迈向“推理时代”。IDC报告明确指出,此时市场需求已完成从模型训练向推理服务的迁移,企业对推理的关注重点从“准确性”扩展到“资源效率、运营成本与可持续发展”,而推理场景的核心衡量单位,正是Token消耗量。

透过这两个拐点,我们也能一窥当前AI模型产业发展的底层逻辑和趋势。

首先值得注意的是,IDC此次选择以“Tokens调用量”作为核心统计指标,而非传统的IaaS(算力、存储)或PaaS(开发平台)打包统计,本质就是抓住了AI应用落地的“真实标尺。

从统计逻辑看,IaaS统计的是“算力供给”,而非“算力使用”——部分云厂商通过低价销售GPU资源冲营收,但大量算力处于闲置状态,无法反映AI应用的实际落地情况;而Token统计的是“模型实际调用”,每一个Token都对应一次文本生成、图像分析或语音交互,是AI与业务场景结合的直接体现。以火山引擎为例,IDC统计未包含其自有业务(如抖音、豆包APP)的Token消耗,若纳入统计,其份额将进一步扩大,这种“剔除水分”的统计方式,更能反映商业市场的真实需求。

从产业价值看,Token消耗量是衡量AI产业景气度的“晴雨表”。

原因有三。其一,Token增长与应用落地强绑定。只有模型足够好用、应用场景足够丰富,企业才会持续调用——火山引擎数据显示,其服务的消费电子行业客户引入视觉理解模型后,5个月内Token消耗增长12倍,日均突破百亿Tokens,这正是应用落地的直接反馈。

其二,Token模式更具可持续性。传统“卖算力”是一次性交易,低价冲量无异于“饮鸩止渴”,客户一旦发现算力闲置便会退租;而“卖Token”是经常性收入,依赖客户持续使用,倒逼厂商优化模型能力与服务体验,形成“模型更好→应用更多→Token增长→模型迭代”的良性循环。

其三,Token具备指数级增长潜力。国家数据局数据显示,2024年初中国日均Token消耗量为1000亿,2025年6月已突破30万亿,一年半增长300倍;某ICT硬件企业通过敏感性测试预测,若Token价格维持当前水平,火山引擎未来1-2年Token调用收入或增长至百亿元——这种增长速度远超传统IaaS(年增速50%-200%),成为AI云市场的核心增量。

火山引擎的MaaS突围:战略、技术与规模的三重优势

在MaaS赛道的竞速中,火山引擎并非最早入局者,却能快速占据49.2%的市场份额,核心源于其在战略、技术与规模上的三重差异化优势。

火山引擎入局云计算市场较晚,若按传统IaaS模式追赶难度极大。火山引擎总裁谭待曾透露,管理层早年曾要求团队思考“2030年的云与2020年有何不同”,最终答案是“AI”,而MaaS正是AI云的核心载体。

与其他云厂商侧重IaaS营收不同,火山引擎从2024年起就将MaaS置于战略高度,投入远超当前营收规模的资源。这种战略定力在2024年5月的降本中尤为明显,每一次动作都精准踩中行业拐点。

在技术方面,火山引擎的技术优势体现在“模型”与“平台”两大维度:在模型层面,豆包大模型家族迭代速度领先行业,目前已覆盖文本、图像、音频、视频等多模态领域。国际评测机构ArtificialAnalysis数据显示,豆包・图像创作模型Seedream4.0的文生图能力位居全球第一,图像编辑能力全球第二;豆包・视频生成模型Seedance1.0pro登顶相关盲测榜单;其实时语音模型更是在C端场景爆火,支持唱歌、辩论等多样化交互,2025年5月豆包大模型日均Token调用量达16.4万亿,较2024年5月的1200亿增长137倍。

在平台层面,火山引擎MaaS平台“火山方舟”经过内部海量业务打磨,性能优势显著。AI基础设施创业公司TensorChord2025年3月评测显示,火山方舟上的DeepSeek-R1模型每秒Token输出量是部分厂商的2.6倍,在首字延迟、并发处理、资源利用率等客户可感知指标上均为行业领先——这源于其底层技术优化,包括PD分离架构、KV-Cache缓存加速、自研vRDMA网络等,能“榨干每一张GPU的Token输出潜力”。

最后是规模的支撑。火山引擎的规模优势来自字节跳动“内外同源”的技术体系——支撑火山引擎外部客户的基础设施团队,与服务抖音、飞书、广告等内部海量业务的团队是同一团队。这种架构意味着,火山引擎在服务外部客户前,已在内部“实战”中验证了技术的稳定性与scalability:例如,其需支撑抖音推荐系统的超大规模稀疏模型训练,这种能力外化后,可轻松满足外部企业的高并发Token调用需求。

目前,火山引擎已服务全球9家Top10手机厂商、8成主流汽车品牌(如奔驰、宝马、特斯拉)、70%的系统重要性银行(如招商银行、浦发银行)以及超五成985高校(如北京大学、浙江大学),这些跨行业客户的持续调用,进一步巩固了其Token规模优势。

结语

IDC的报告不仅是对过去市场格局的总结,更是对未来趋势的预言。随着多模态技术和Agent应用的成熟,单个任务消耗的Token量将呈几何级数增长,AI应用的想象空间将被彻底打开。

在这场变革中,谁能提供效果最好、成本最低、性能最强的模型服务,谁就能吸引最多的开发者,催生最繁荣的应用生态,从而在“Tokens经济”的浪潮中占据主导地位。

火山引擎凭借其在MaaS赛道上的战略定力、技术积累和规模优势,已经抢得先机。49.2%的市场份额不仅是一个数字,更是市场对其战略和执行力投出的信任票,预示着在即将到来的AI应用大爆发时代,它将扮演更加重要的角色。