咨询QQ:
      杂志订阅

      编辑

      网管

      培训班

      市场部

      发行部

电话服务:
 010-82024984
 010-82024981
欢迎, 客人   会员中心   帮助   合订本   发布信息
设为首页 | 收藏本页
谈东数西算的东边的数据如何送到西边去算
  • 继新基建之后,2021年国家又启动了东数西算的战略决策,也是南水北调、西电东输、西气东输之后又一个新基建的标志性工程。当前东数西算关注的热点是网络枢纽的部署,利用西部的能源和气候条件优势新建数据中心,缓解东部能源紧张的压力。然而如何实施东部的数据和算力的西迁才是东数西算战略落地的核心和终极目标,因此需要从这个角度深入研究和探讨。
  • 一、东数西算是全国网络和算力一体化布局的国家级工程
      
      我国的人口、经济和GDP集中在中东部地区,按照黑河——腾冲线(中国地理学家胡焕庸提出的人口密度与气候对比线),中东部地区44%的土地居住了94%人口,创造了95.7%GDP,见图1。在我国八纵八横的高速公路和铁路网和航线部署在中东部地区。中国的500强的企业和汽车工业都分布在中东部地区;大部分的高等院校、科研都集中在中东部地区,见图2。当前我国已进入数字化的时代,互联网、联网+的应用已融入千家万户的日常生活。然而微信、交通出行、购物等活动,也都集中在中东部地区,见图3。
      


      我国数字经济从2020年的11万亿到2021年的45万亿;数字经济GDP由21.6%增至39.8%。可见经济的发展、数字化转型,数据和算力主要在中东部地区。因此不是所有“东数”都要“西算”,“东数西算”一定是建立在满足人们需求的基础之上,再实现资源最优配置。
      
      “东数西算”是我国继“南水北调”“西电东送”“西气东输”以后,又一项优化资源配置、一体化布局的国家级工程,见图4。
      
      “东数西算”不能简单理解为:把东部地区产生的数据拿到西部运算,减轻中东部土地、环境和电力的压力。事实上,东数西算横跨了网络、数据、科技、经济、资源、能源等诸多领域,今年国家在东、中、西部的京津冀、长三角、粤港澳大湾区、成渝、内蒙古、贵州、甘肃、宁夏8地启动建设国家算力的10个集群,这10个集群东部占有4个,中部占有3个,西部只有3个,见图5。
      
      因此东数西算不是简单的一刀切,而是全国“一盘棋”的统筹调度,保持东持西扩的态势,通过在西部构建需要的大数据一体化的新型算力网络体系,将东部算力需求有序引导到西部,优化数据中心建设布局,促进东西部协同联动,从信息化的角度为西部大开发提供新的增长点。
      
      二、东部的数据如何送到西部去算
      
      据工信部提供的数据,2021年底我国的数据存储容量达到800EB(1EB=1024PB);算力总规模超过140EFlops(每秒浮点数运算次数),然而我国数据存量和算力主要集中在中东部地区。虽然在东数西算的网络枢纽已经在部署,但需要盘点、分析和研究哪些数据可以放到西部去算,如何增加西部算力和数据存储的能力才能满足东数西算的要求。
      
      1.西部的数据的处理需要从东部回流
      
      当前有许多西部的数据,如我国西部石油勘探;天气预报、地质、地震、冰川、沙漠、风沙、土壤以及自然灾害的研究;航天发射和测控、包括百姓日常衣食住行的网络数字化等每年都会产生大量的数据,这些数据很多都送到东部来处理。随着互联网的飞速发展,一些全国性的企事业单位(如金融、互联网、电商)将原本在各省处理的数据实施了数据的大集中,迁移到东部的数据中心处理。加剧了东部数据中心超规模的建设和发展,加剧了基础设施、网络带宽和速率要求。因此需要在西部建立满足自身需要的数据中心,对全国性的业务系统采取分布式处理架构或采用去中心化区块链技术、边缘数据中心(边缘数据中心具有靠近用户、物理分散、逻辑统一的特点)的研究和建设。将原本西部的数据留在西部就地处理,只有需要跨省交换的数据才送到集中处理的中心处理。
      
      在网络传输方面:海量的数据不再需要上传至远端进行处理,大大降低了网络延时;同时核心网传输压力下降,避免了网络堵塞。
      
      在可靠性方面:本地化的数据中心成为数据的第一入口,具备对海量业务数据的实时分析处理能力,以及高性能的数据处理及传输可靠性。
      
      在部署特点方面:本地数据中心部署非常靠近信息源,具有属地化(地级市及以下)部署特点,分布极为广泛,满足属地用户需求,具有规模小、数量多、分散部署等特点。
      
      只有这样才会有效扭转西数东算局面,大部分的数据不要集中到东部的大城市处理,减轻网络和东部数据中心不断膨胀的压力。
      
      2.数据备份和灾备往西迁移
      
      随着数据化的转型,我国已经进入数字化的时代。数据作为新的生产要素,成为重要的有形资产。从数据自身的安全和监管部门的要求,数据安全保护和业务系统的灾备成为行业信息安全的必不可少的最后一道防线,因此很多的行业都建立了自己的灾备中心,而且这些灾备中心大部分都建在中东部地区,同样加剧了东部土地和电力不足的压力。以金融为例,大部分灾备都在中东部地区部署,见表1。
      
      由于备份的数据使用率不高,大量的历史数据长期处于冷备状态,很少使用;灾备中心的业务系统只有在遇到生产中心发生重大的故障或灾难时才会启用;从国家安全的角度更需要考虑数据的备份和灾备中心的西迁;今年国家为东数西算启动建设的8个网络枢纽和10个算力集群的节点,已完全满足网络传输的要求。目前国家科技管理信息系统灾备数据中心已落户青海西宁,国家水利部数据灾备中心在贵州开通运行,因此数据的备份和业务系统的灾备西迁不仅可行且势在必行。
      
      3.对网速和延迟不高的数据放到西部去算
      
      一些对于后台加工、离线分析、存储备份等对网络要求不高的业务可率先向西部转移。这些数据有档案和历史文献的录入和保存、影视的后期剪辑、石油勘探、天气预报、基因序列排列组合、模拟地震、新药研发、空气流体动力学、燃料消耗、结构设计、防撞性,材料科学与计算、纳米技术应用、模拟核试验、密码分析等等,这些数据的处理不需要完全依赖网络的实时传输和交互,而是需要有强大的算力,尽可能用最短的时间取得结果,这些结果一般以数据、图表、云图、剖面图等方式呈现,是完全可以在西部去处理。
      
      算力可分为三大类:高性能计算的算力(HPC算力或超算)、人工智能计算的算力(AI算力或智算)、数据中心的算力(通用算力)。在三大算力类型中,HPC、AI算力建在西部是没有问题的。HPC做中长期天气预报的计算,一算就需要数小时,中间也不必进行数据交换;石油勘探的数据处理同样需要强大的算力;早在上世纪八十年代已将银河超级计算机和IBM3083高性能的计算机用于我国的天气预报和石油地震数据的处理;AI模型的训练一连几天的时间,因此这些对网络实时性要求不高的应用都可以放在西部。
      
      4.依赖网络的全国大集中系统也可以西迁
      
      前面提到对网速和延迟不高的数据放到西部去算,那么对完全依赖网络的业务应用能否可以西迁?实际上早在2010年以前工农中建交五大银行在3G时代就已完成全行数据的大集中,并在北京或上海完成全行一个中心的建设,网络延伸到全国各省、市、县的上万个金融网点;甚至有些银行还完成海外分行系统的在国内的监管;央行的征信系统完成与数千家银行的对接;近几年支付宝和微信支付已覆盖全国并延伸到海外。随着京津冀、长三角、粤港澳大湾区、成渝、内蒙古、贵州、甘肃、宁夏8地启动建设国家国干网络枢纽和10个算力枢纽节点部署以及5G的覆盖,为完全依赖网络的服务的区域或全国业务的系统离开东部城市实施西迁提供更有力的保障。这部分业务系统数据中心西迁,不仅进一步缓解东部土地、电力紧张的压力,也有利于国家双碳目标的落地;同时疏解北京非首都功能,探索经济密集地区优化开发新模式,调整优化北上广等东部城市布局和空间结构。
      
      应该可喜的看到金融数据中心的规划和布局已开始实施西迁的战略转移,中国银行、农业银行、建设银行率先投资数百亿,在内蒙和林格尔建设全中国最大的金融科技中心,这些数据中心建成后可承载数百万台服务器运行。这些银行正在加快下一代的新型数据中心服务能力研发和建设,将各自服务于国内34个省市(含自治区、直辖市和特区)上万个金融网点和覆盖全球61个国家和地区海外分支机构,见图7、8。
      


      兴业银行今年也启动在贵阳的贵安新建超大型的数据中心规划,机架数超过10000个,见图9。
      
      三、东数西算面临的困难和挑战
      
      东数西算是继南水北调、西电东输、西气东输之后又一个国家级的战略工程,将投入巨资在东、中、西部建立8个算力网络的骨干枢纽。从全国“一盘棋”的角度统筹规划,推动优化算力资源配置,优化数据中心建设布局,促进东西部协同联动的重要抓手。但是还应看到东数西算存在以下需要关注和有待解决的问题:
      
      1.东数西算不是钢需
      
      无论是南水北调还是西电东输和西气东输,包括北煤南运,是供给测有丰富的资源,目的地有钢需,是强强联合,解决了西部资源的过剩和带动了西部的大发展。而对东数西算来说,数据和算力的钢需在中东部,从使用和管理的角度更希望处理的中心靠近行业总部所在地。要将东部的数据送到西部去算,再回到东部来使用,会出现使用不方便、管理难度大、网络成本高等认识上的偏差,不会积极主动的去关注和落实东数西算转型。对企业来说东数西算需要做战略部署规划的调整,投资、营运和运维方式的转变,客户接受度的转变。因此需要政府出台相应的政策和调控机制来引导将东数西算的战略赋予落地,包括对某些业务和数据必须西迁的强制要求。
      
      2.加快西部超算中心的建设,提高西部的算力
      
      中国是世界上人口最多的国家,信息科技已形成巨大的产业规模,在数据方面:仅以2018年的数据,中国产生的数据站全球的23%,美国为21%;从算力方面2020年美国算力是全球的36%,而中国为31%。来自工信部的数据我国算力总规模超过140EFlops(每秒浮点数运算次数),我国算力规模达到全球第二,然而这些算力都部署在中东部地区。仅以我国的超算中心为例,10个国家级的超算中心均分布在中东部地区,见图6。
      
      可见西部的算力严重不足,会影响到东数西算的进程和落地,因此东数西算要在西部满足算力的支持,需要加快西部超算数据中心的建设,为石油勘探、中长期的天气预报、航天、国防、自然灾害的跟踪和预测等大数据应用提供超算的处理能力。
      
      “东数西算”战略之下,算力网络建设是一个发展的方向。“算力网络”就是把很多机器通过网络连在一起做事,在目前的技术还不可能实现,主要面临两大困难——并网和调度。并网需要把算力连接起来,这不是简单的网,需要带宽高、时延低。如果能做到,在北京打电子游戏的客户,机器放在西部照样能玩。应该看到电商、物流等头部互联网企业在做这方面的尝试。
      
      3.数据中心上中下游的供应和支持
      
      数据中心是一个系统工程,需要有基础设施(风水冷电设备)保障,需要提供强有力的网络、算力和存储的支持,还需要有各种应用系统的部署,涉及到数据中心上中下游的各个专业,见表2。
      
      然而支撑数据中心上中下游的设备、应用技术和服务大部分都在中东部地区,因此实施东输西算战略,同样需要中上下游的设备供应、网络和应用技术的开发和服务商的西迁,才能有效地支持和保障东数在西部处理的稳定运行。
      
      4.科技和技术人员短缺
      
      东输西算的落地需要大量的科技人员支持,离不开基础实施保障(风水冷电和网络)专业人员的服务,而每年大部分的毕业生都选择留在中东部经济和科技发达的地区;还有一部分西部的技术人员孔雀东南飞加剧了西部科技人员严重的短缺。目前在西部即使数据中心日常维护的电力、暖通、基础网络的专业人员出现有岗而无合适人员的短缺,只有高薪从中东部引进这方面的专业人员。
      
      因此,吸引相应专业的技术人员是东数西算落地的重要保障,一方面需要相关专业技术人员随东数西算的项目西迁,就像国家五六十年的东部大学西迁和六七十年代的大三线建设一样,实施对口支援;另一方面需要加强相关专业技术培训,就地培养相应的专业人员;再有利用网络和AI的高科技技术实施远程的监控和管理,通过远程的服务,弥补相应的短板。
      
      5.重基础设施建设,轻应用系统落地
      
      新基建推动数据中心建设热潮,在西部的内蒙、甘肃、宁夏、贵州,包括四川、重庆以及云南已经建设了大量的数据中心,形成数据中心的集群。来自工信部的数据,2021年底我国在用的数据中心机架总规模超过520万架,2021年底我国大型、超大型数据中心达到450个。平均上架率超过55%,在用数据中心服务器装机规模1900万台。可见还有45%的闲置,可以满足1000万台服务器装机容量,还应该看到西部闲置高于东部地区。当前随着东数西算的战略落地又有不少企业和第三方的投资者进军西部开始了新一轮的数据中心建设,将会加剧数据中心基础设施的过剩和闲置趋势。东数西算的目的是将东边的数据迁到西部去算,再将结果回流到东部去使用,缓解东部电力和土地资源的不足。当务之急是需要盘活西部现有数据中心基础设施的存量资源,在西部部署相应的算力和应用,这样才能将东部的数据送到西部区算,而不是新一轮的数据中心基础设施的建设,谨防加剧新的数字地产的过剩显现,闲置率过高不仅浪费国家的能源指标,同时又迟迟产生不了应有科技和经济增长。
      
      6.社会责任
      
      东输西算是国家解决东部电力和土地资源紧张,实现2030和2060双碳目标的举措,也是有力支持和带动西部大开发。因此无论是充分利用西部的能源和独特的地理环境(气候和土地),还是努力实现双碳目标进程,对于每一个行业和企业都是要响应国家战略的决策,积极响应国家的战略部署,也是义不容辞的社会的责任和贡献。
      
      四、结束语
      
      “东数西算”工程的开启,如何把国家算力枢纽平台与各省市算力调度平台建设有效结合提出新的挑战,“东数西算”工程需要一改过去的基建那样“大水漫灌”,而是一个循序渐进的系统性工程。特别是目前阶段,除了8个算力枢纽和10个数据中心集群的宏观布局,除了关注PUE的指标外,更需要关注和落实:
      
      1.从国家层面在西部增加算力的部署;同时引导和鼓励科研、行业和投行将算力和数据西迁,为东数西算的落地创造有利的条件。还有企业积极将响应国家东数西算的战略目标为己任,将能够西迁的算力和数据送到西部去处理。
      
      2.谨慎有序的控制新建数据中心建设,盘活现有闲置的数据中心,提高上架率(∑服务器上架运行的能耗/∑所有机架设计能耗),将已有集群内数据中心的平均上架率提高到70%以上。
      
      3.绿色计算,不仅要衡量数据中心能效PUE的指标,还需要追求和考核算力与能耗的比值指标,充分调度和发挥算力的使用效率。
      
      作者简介
      
      杨晓平,毕业于中国人民解放军国防科技大学计算机专业,高级工程师;原中国银行上海数据中心安全处处长/江苏银行资深技术经理。
      
      从事IT领域工作50年,在科研、石油、金融等行业的信息科技部门工作经历。参加我国银河超级计算机的研制,熟悉IT架构、系统集成、规划、信息安全、数据中心的建设、两地三中心规划与建设,数据大集中和数据中心运维、数据中心的检测和认证;参加《数据中心设计规范》、《数据中心等级评定》、《数据中心运行维护管理标准》等多个数据中心标国家和团体准编审。
      
      受聘于中国数据中心工作组(CDCC)、中国数据中心产业发展联盟(IDC)、中国计算机用户协会数据中心分会(CDCC)、北京灾备技术产业联盟、中国电子节能技术数据中心节能技术委员会(GDCT)、国家互联网数据中心技术创新产业联盟专家技术委员会(NIIS)、绿色网格(TGGC)工作组、中国计算机用户协会审计分会专家技术委员会委员。数据中心测评和认证高级认证师;中数智慧信息技术研究院专家顾问,中治研(北京)国际信息技术研究院高级研究员。
      
      编辑:Harris
      
      

     

  •