谋划“全国一台计算机”发挥我国算力体系化发展优势
“全国一台计算机”指面向未来社会需求谋划布局的“新型算力服务系统”,将算力基础设施、算力供给、算力运营模式和算力生态培育一体化考虑,建立安全可控、灵活高效、开放互动、智能友好、绿色低碳算力服务能力。当前,人工智能大模型训练亟须超高计算密度、超大规模算力和超快训练速度的智能算力平台支撑,在“大算力+大模型”发展背景下,模型快速迭代、算力需求倍增。2023年2月,中共中央、国务院印发的《数字中国建设整体布局规划》提出,“系统优化算力基础设施布局,促进东西部算力高效互补和协同联动,引导通用数据中心、超算中心、智能计算中心、边缘数据中心等合理梯次布局”,为新时代布局新型算力服务系统指明了方向。2023年10月,工信部等六部门联合印发《算力基础设施高质量发展行动计划》,提出到2025年智能算力占比达到35%的发展目标。因此,面向以智能算力为代表的海量计算需求,加快布局新型算力服务系统,是建立“全国一台计算机”发展新格局、建设打通数字基础设施大动脉、夯实数字中国建设基础的必然选择。
发展新型算力服务系统,服务我国多元化算力需求
近年来,随着人工智能、数字孪生、元宇宙等新兴技术的迅速发展,全球算力需求规模呈爆发式增长,而原有分散式布局的数据中心难以满足新兴领域海量高性能计算需求,迫切需要布局新型算力服务系统。
第一,发展新型算力服务系统是将中国打造为全球算力成本洼地,抢占全球算力竞争制高点的关键抓手。算力是数字经济时代集信息计算力、数据存储力、网络运载力于一体的新型生产力。当前,人工智能撬动了新一轮科研范式变革,带来海量智能算力需求。建成全球算力成本洼地对于激发数据要素创新活力,加速数字产业化和产业数字化进程,催生新技术、新产业、新业态、新模式,支撑经济高质量发展有着重要作用。我国亟须探索通过降低算力建设运营成本、创新算力模式提供多样化的算力供给方式,降低算力成本,提供属性多元、服务模式多元、网络系统多元、技术场景多元、运营模式多元的体系化算力系统,形成我国产业发展和经济发展的优势基础,形成全球企业和机构在我国发展的磁吸力。
第二,发展新型算力服务系统是将中国建设成为全球创新高地,形成全球算力长板的重要支撑。依托新型算力服务系统建设,以可负担的价格对外提供算力服务,用低成本的普遍算力服务激发社会各主体的创新能力,发挥数据的要素价值。数据作为新型生产要素,依托大数据、大算力、大模型为人类认识世界引入了新范式,增强了科学发现能力。人工智能大模型需要依托智能算力大集群的长期训练,依托“全国一台计算机”发展知识计算引擎与知识服务技术,形成广泛的智能推理能力,促进建立新的知识图谱,研究效能得到极大提升,吸引全球创新资源向中国汇聚。
第三,发展新型算力服务系统是全面提升我国信息通信产业创新能力,形成我国体系化能力的重要契机。现阶段我国亟须探索“以网强算、算网融合”的体系化中国方案,充分发挥我国在通信领域的领先优势,“以网强算”带动算力领域由被动跟随转向主动引领,全面提升信息通信产业的自主创新能力和国际竞争力。通过算力网络布局,算力网络发展催生出的新动能将促进我国新型信息基础设施升级,提升全社会算力及其之间连接的使用效能,以此形成的新优势将进一步促进人工智能、大数据等信息通信技术相关产业发展,实现到2035年我国数字化发展水平进入世界前列,数字中国建设取得重大成就的目标。
新型算力服务系统发展的主要挑战
近年来,我国算力网络规模发展迅速,然而仍然面临缺乏整体统筹、技术标准体系不完善、多元化算力需求尚未有效满足等多方面制约,主要表现在以下几个方面。
第一,算力供给中缺乏对“多元主体、算网融合、数算匹配”的有效统筹。我国算力供给侧市场内部竞争激烈,阿里云、华为云、腾讯云、百度云、天翼云、移动云、联通云等国内相关厂商为争夺市场份额,不断降低价格及收益,致使国内企业利润水平普遍远低于国外企业,甚至出现亏损的情况。由于全球算力网络尚处于技术研发与产业布局初期,低价竞争导致的盈利不足可能进一步影响企业对可持续研发投入的能力和意愿。
第二,我国智能算力底层技术能力亟待提升。全球竞争的背景下,智能数据中心主流计算芯片等核心元器件多数被国外企业垄断,我国在智能算力规模和算力核心技术方面与国外仍存在差距。人工智能技术体系包含芯片、框架、工具包、应用大模型等多层。绝大多数互联网公司和公共部门的数据中心底层基础设施依赖于国外供应,我国自主人工智能芯片、框架等难以满足我国快速增长的智能算力需求,亟须建立智能算力芯片、软件、终端、服务的全栈能力。
第三,我国算力体系结构和标准亟待优化。我国算力布局仍存在结构性失衡问题。例如,我国已经建立的国家超级计算中心商业化应用门槛较高,而大量中小型数据中心在运算能力、算法工具、软件支持等方面无法完全满足企业需求。在“东数西算”建设过程中,算法架构、软硬件与接口标准缺乏,目前,不同厂商建设的数据中心包含不同类型指令集、不同体系架构的异构硬件,算力网络支持多样化算力需要适配不同厂商的基础设施硬件架构,导致算力网络对于数据与计算资源的协同和统筹能力不足。
第四,低成本、多元化、异构算力需求未被有效挖掘。当前,算力逐步从中心侧向边缘侧、端侧扩展,形成了云-边-端三级算力架构,以支撑工业、制造、金融、能源、安防、游戏、视频等多样化智能应用场景的不断落地。但是,我国尚未建立面向不同行业与个人用户需求的可持续的运营模式,供需错位问题突出。因而,亟须在国家层面、省市级层面、企业层面、业务层面进行算力设施供需匹配,开展面向性能、面向价格、面向效益的多方面测算。例如,“东数西算”亟须向时延要求高的应用场景拓展。然而,虽然已有部分互联网巨头公司在我国西部地区布局建立了数据中心,但主营业务仍以数据容灾备份、离线数据存储为主,这种“东数西存”模式的产业辐射能力较弱,不利于我国数据中心相关产业生态长远发展。
多举措推动我国新型算力服务系统发展
为有效应对我国新型算力服务系统建设面临的挑战,我国亟须进一步加强顶层设计,推动新型算力服务系统建设运营主体形成合力,建立我国算力网络发展优势。
第一,发挥新型举国体制优势,将政府力量和市场机制有机结合。在总算力规模和全球领先的通信网络基础上,建设超大规模高速广域计算集群(“大集群”),提升国家综合算力能力(“大算力”)是现实选择的中国落地方案。在创新机制上,应充分发挥新型举国体制优势和基础设施优势,有效市场和有为政府有机结合,尊重市场规律,避免强制性算力调度主导制度造成的投资浪费、市场和经济效益低下、限制市场主体创新意愿的弊端。在运营服务上,政府应当采取灵活模式,建设新型算力服务系统基础设施、算力底层核心技术(芯片、操作系统等)等安全保障,同时加大对普遍服务公用事业性质算力设施建设和运营主体的政策支持,引导搭建和完善城市公共数据库、行业数据库、知识库等,加快公共算力服务的发展,支撑我国在全球高科技竞争中赢得主动权。
第二,加强关键核心技术攻关,系统构筑我国智能算力发展的优势地位。提升我国人工智能底层技术与共性技术对新型算力服务系统的支撑能力。首先,发挥我国体系优势和基础设施建设优势,国家层面引导和扶持智能计算关键共性技术攻关,降低人工智能芯片等核心元器件技术劣势带来的不利影响。其次,加快以人工智能技术底层关键为引擎、以工程化产业化为导向的技术创新体系建设。推进“政产学研金服用”合作,提供技术创新关键要素供给,在科技领军企业牵头下,组织国家实验室、国家研究机构等国家战略科技力量组建创新联合体、新型研发机构,突破处理器等重要环节的共性关键技术。借鉴美国国家人工智能研究资源(NAIRR)基础设施建设路线图计划联合美国主要企业与研究机构云平台,提供包含数据、算力、测试床、软件工具等服务和资源模式,在人工智能芯片、算力、算法、云服务提供商等多方面构建算力体系化的竞争优势。
第三,构建我国新型算力服务系统软硬件标准与安全体系。构建自主开放的新型算力服务系统国际化技术与互联标准体系。推动全国新型算力服务系统一体化标准建立,形成包括新型算力服务系统架构、节点互联标准、应用接口标准、人工智能数据集接口标准等在内的标准体系,兼容多样化算力和开发框架等软硬件平台。系统识别算力产业新兴核心技术环节,确定重点核心标准突破口,联合政府、行业协会和企业力量,构建开放完善的计算技术、架构类标准体系。
第四,探索面向政府等公共事业部门的城市基本算力保障,提供低使用成本、高安全性算力服务。首先,在管理体制创新方面,可以对公用事业型和行业领域的新型算力系统建设,在资金、项目上给予配套政策,以及制定特定领域特许经营的特定办法。其次,在低使用成本方面,政府向公共事业机构补贴计算资源费用、算力基础设施建设运营补贴等,降低公共事业机构算力建设运营成本,促进其在算力服务上的应用和创新。此外,在高安全性方面,一方面采取各种安全措施来保护客户数据,包括数据加密、访问控制、身份验证等,另一方面,算力网络基础设施采用零信任、区块链、隐私计算等新型安全技术,从而在数据安全、应用安全、网络安全等维度构建新型技术设施安全架构。
第五,加强算力网络布局,提升对智慧城市、科教、公共事业等重点行业的带动作用。推动算力网络建设优化。加快布局基础电信运营企业网络资源,推进网络架构优化,持续提升网络容量、优化流量疏导路径。优化接入网络,支持算力资源的高速接入和高效调度。加快进行确定性网络等未来网络部署。在算力调度层面,通过分布式算网大脑统筹考虑可用算力容量、成本、网络传输效率等多维属性,为重点行业提供确定性有保障的服务。建立应用场景,应深入挖掘算力网络在新型信息消费、智慧城市、智能制造、工业互联网、车联网等场景的融合需求,强化算力应用推广,充分发挥算力对制造、金融、教育、医疗等各行各业的赋能作用,加强杀手锏应用探索。