2025年,AI模型、AI算力、AI应用彼此推动,呈螺旋上升之势。传统云架构也正在被打破,朝AI云原生的方向演进。
国际市场调研机构IDC数据显示,2024下半年,中国公有云市场增速17.7%。
2024年5月,火山引擎将大模型推理成本降低了90%以上,这一策略不仅降低了客户使用AI的成本,还迫使其他云厂商跟进降价。成本的下降带来了市场的扩容。据IDC数据,2024年12月中国公有云大模型日均token调用量高达9522亿,这一数字是2024年6月日均调用量963亿的近10倍。
6月11日至12日,2025火山引擎原动力大会在京举办。新华社记者张漫子摄
而2024年大模型调用总量中,火山引擎市场份额达46.4%。截至2025年5月,豆包大模型日均tokens调用量16.4万亿,相比2024年5月的1200亿增长137倍。
“把时间拉长,我们正处于PC时代到移动时代再到AI时代的变化之中。技术主体也在发生变化:从网页、App,变为AI智能体。”日前在京举办的2025火山引擎原动力大会上,火山引擎总裁谭待说。
应用范式的变化,正带来云计算基础架构的创新。过去几年,传统云计算的产品创新几乎是停滞的,谈到云计算,人们常提起的是IaaS、PaaS(平台即服务)、SaaS(软件即服务)。而在AI时代,AI模型快速迭代、AI应用加速爆发、AI算力指数级增长,这个分层结构正被消解。
谭待说,IaaS、PaaS、SaaS的架构更关注技术分工,而AI云原生更多是按照业务架构重新划分IT架构。具体而言,是以Agent为核心重新优化计算、存储与网络架构。目标是让算力基础设施能在单位时间内更快、更多地产生token,以使AI应用的响应速度越来越快。
“复杂的Agent、完成好复杂任务,不仅需要模型优化,背后的服务也得优化,还要准备好调优的环境等。把基建做好、把池塘做大,这是最重要的事情。”谭待说。
声明:本网转发此文章,旨在为读者提供更多信息资讯,所涉内容不构成投资、消费建议。文章事实如有疑问,请与有关方核实,文章观点非本网观点,仅供读者参考。

