电费、布局与算力劵 新政策背后的智算成本账
近日,工信部等六部门联合印发《算力基础设施高质量发展行动计划》,明确目标为,到2025年,计算力方面,算力规模超过300EFLOPS,智能算力占比达到35%,东西部算力平衡协调发展。
IDC圈注意到,《计划》部署6个方面25项重点任务,包括:结合人工智能产业发展和业务需求,重点在西部算力枢纽及人工智能发展基础较好地区集约化开展智算中心建设,逐步合理提升智能算力占比。
结合此前多地出台政策提出的智能算力目标与规划,以及AI大模型带来的智算需求激增态势,智能算力增长规模超越通用算力将成为必然。而除了算力项目的类型与规模之外,算力布局与应用也将迎来改变,新挑战与新机遇正在涌现。
AI驱动应用与算力变革 智能算力成增长主流
科技创新驱动生产生活方式变革,正如电的发明和应用带来第二次工业革命,移动互联网开启万物互联,云计算让企业IT迁徙上云,以及当下ChatGPT引发的AIGC热潮。
由于高效的生产力与简单的交互方式,AIGC浪潮在带来生产力变革的同时,还将带来商业模式、应用门槛、底层架构等众多变革,产生大量新市场机会。
首先,移动互联网、数字化的服务应用场景,转变为所有应用都要拥抱AI或被AI改造,企业数智化取代数字化。现有的传统应用和云原生应用,将转变为云原生应用+AI应用,企业的业务更复杂,业态更丰富,对技术和平台的挑战越来越多。
其次,应用创新从以CPU为核心变成以GPU为核心。百度智能云事业群总裁沈抖表示,随着大模型时代到来,GPU慢慢成为算力的中心,GPU算力增长速度远远超过CPU,云正在从CPU云时代向GPU时代切换。
其三,成本变化。华为云人工智能领域首席科学家田奇曾表示,AI大模型的资本门槛高,大模型开发和训练一次1200万美元。
回溯至大模型产品底层,作为承载的算力也在发生变化。IDCC2023上海站的嘉宾在演讲中表示,由于网络、资源利用率、传统存储性能瓶颈等因素,传统的通用算力在人工智能时代无法满足AI算力的要求,“它们已经成为AI算力的瓶颈”。
因此,智能算力成为新一波AI热潮下的“必需品”。
当前智能算力增长率呈现出远高于通用算力和整体算力增长的态势。中国信通院发布的《中国综合算力指数(2023年)》显示,截至2023年6月底,我国算力总规模达到197EFLOPS,其中智能算力规模占整体算力规模的比例提高到25.4%,智能算力规模同比增长达45%,比算力规模整体增速高15个百分点。
政策规划+算力劵鼓励 产业项目踊跃落地
随着AIGC带动算力需求迅猛增长,多方积极部署智能算力建设发展,各地陆续出台相关政策,产业也反响热烈。
2023年1月,《成都市围绕超算智算加快算力产业发展的政策措施》提出:加快构建智算体系。支持在天府数据中心集群起步区建设一批与生物医药、安防、交通等领域紧密结合的智算中心。
2023年5月,《北京市加快建设具有全球影响力的人工智能创新策源地实施方案(2023-2025年)》提出,按照集约高效原则,分别在海淀区、朝阳区建设北京人工智能公共算力中心、北京数字经济算力中心。在人工智能产业聚集区新建或改建升级一批人工智能商业化算力中心。
2023年7月,《河南省重大新型基础设施建设提速行动方案(2023—2025年)》发布,提出实施高性能算力提升工程。加快建设郑州、洛阳等全栈国产化智能计算中心,构建中原智能算力网。到2025年智算和超算算力规模超过2000PFLOPS,高性能算力占比超过30%。
今年7月末举行的2023世界人工智能大会,上海经信委表示,上海即将发布“人工智能大模型创新发展若干措施”,打造人工智能世界级产业集群。新措施将打造破解发展瓶颈的3项计划,其二为智能算力加速计划,强化大规模智能算力建设力度,建立绿色通道保障能耗指标,实施AI算力券,加快建设极速智能算力承载网。
针对智能算力建设的高成本,各地在出台发展规划的同时,也给出了布局和应用指引,出台算力劵政策切实助力智算发展。
苏州市发布的《苏州市关于推进算力产业发展和应用的行动方案》,包含对半导体和集成电路、EDA、软件和信息服务等算力企业的一系列资金支持和补助,最高奖励或补助高达1000万元。
北京市本月发布的《人工智能算力券实施方案(2023-2025年)》明确。企业与智能算力供给方签订智能算力服务合同后,可申领算力券,企业单次申领算力券金额最高不超过智能算力合同额的20%。
宁夏印发《促进人工智能创新发展政策措施》,支持落地企业开展大模型训练。对于参数量超过百亿、典型应用场景超过5个的大模型,给予最高1000万元资金支持。
需求与政策双重驱动下,智能算力供给能力正在进一步提升。
今年以来,众多智算中心项目如雨后春笋般落地开工,国家信息中心与相关部门联合发布的《智能计算中心创新发展指南》显示,目前全国有超过30个城市正在建设或提出建设智算中心。
成本牵动智算布局 哪些去一线哪些去西部
如前文所述,在新一波AI浪潮下,推动数字经济高质量发展需要不断壮大算力规模,提升智能算力供给能力,激发创新活力和应用潜力。
正因如此,工业和信息化部、中央网信办、教育部、国家卫生健康委、中国人民银行、国务院国资委等六部门联合印发的《算力基础设施高质量发展行动计划》,提出了“到2025年,计算力方面,算力规模超过300 EFLOPS,智能算力占比达到35%,东西部算力平衡协调发展”的目标。
在建设如火如荼的同时,智算也存在高能耗隐忧。
单芯片功耗逐渐增大,用于AI训练与推理的GPU能耗持续上升。OpenAI的分析报告显示,自2012年以来,AI训练应用的电力需求每3个月到4个月就会翻一倍。而根据斯坦福人工智能研究所(HAI)发布的《2023年人工智能指数报告》显示,1750亿参数量的GPT-3,耗电量就已高达1287兆瓦时。
高能耗带来计算的高成本,其中训练成本占大头。成功推出“文心一言”的百度执行副总裁沈抖就表示“训一轮你得扔几千万进去。”
解决方式是构建分布式AI算力。大模型相关从业人员表示,“推理过程对GPU的算力要求没那么高,但是对时间比较敏感,要求在一定时间内就要返回推理结果。但训练过程对GPU的算力要求很高,对时延要求相对宽容。”
整体来看,可以将部分智能算力布局在更靠近用户侧的一线沿海城市,满足推理的低时延需求,将训练所需的对应算力建设到成本更低的区域,以及一线周边地区。
因此,未来算力的分布将更加分散。在能源供应、能源价格、绿色节能上具备优势的区域,将成为承接未来AI训练对大规模高性能智能算力需求的理想选择。
政策也正在这样引导。《算力基础设施高质量发展行动计划》提出,结合人工智能产业发展和业务需求,重点在西部算力枢纽及人工智能发展基础较好地区集约化开展智算中心建设,逐步合理提升智能算力占比。
另一方面,在北京上海两大热门IDC市场,智能算力项目的审批明显宽松于数据中心项目。有行业人士也在研究将传统数据中心改造为智算中心的可行性。
在AIGC热潮的当下,新一轮算力变革正在悄然发生。