咨询QQ:
      杂志订阅

      编辑

      网管

      培训班

      市场部

      发行部

电话服务:
 010-82024984
 010-82024981
欢迎, 客人   会员中心   帮助   合订本   发布信息
设为首页 | 收藏本页
数据中心运维节能工作的基本原则
  • 数据中心耗能巨大,在数据中心运维节能工作中哪怕微小的节能比例,对于整个社会而言都是很大的节约,此工作的展开应遵循一些主要原则。
  • 数据中心耗能巨大,在数据中心运维节能工作中哪怕微小的节能比例,对于整个社会而言都是很大的节约,笔者认为此工作的展开应遵循如下主要原则:1.运维节能需遵循相关的法律、法规、标准和政策性文件;2.运维节能需充分利用自身条件;3.运维节能需与运维安全相平衡;4.运维节能需与设备冗余相平衡;5.运维节能需注重资源的平衡利用;6.运维节能不可因局部破坏整体;7.运维节能改造、变更需与业务时间窗口相匹配;8.运维节能技术选择宜经过相关验证或有相关案例;9.运维节能需注重点滴积累;10.运维节能需处处留意、注意细节;11.运维节能工作需考虑综合用能;12.运维节能投入需与回报相匹配。
      
      数据中心运维工作的目标是保证数据中心安全、稳定、绿色、高效的运营。为达到数据中心的高效运营和节能目标,需与数据中心总体业务方针和其他管理体系相协调,并确定数据中心节能策略的基本原则,笔者认为应包含以下几条主要原则:
      
      一、运维节能需遵循相关的法律、法规、标准和政策性文件
      
      2021年3月15日,中华人民共和国国民经济和社会发展第十四个五年规划和2035年远景目标纲要正式发布并提出:“加快构建全国一体化大数据中心体系,强化算力统筹智能调度,建设若干国家枢纽节点和大数据中心集群”。可以看出,数据中心作为新基建的基石,是推进我国数字经济发展的重要保障。根据国务院发布的《2030年前碳达峰行动方案》,2021年12月8日,国家发展改革委、中央网信办、工信部和国家能源局四部门印发《贯彻落实碳达峰碳中和目标要求推动数据中心和5G等新型基础设施绿色高质量发展实施方案》。该方案明确了强化统筹布局、提高算力能效、创新节能技术、优化节能模式、利用绿色能源、促进转型升级等六个主要任务,提出多种措施开展节能降碳。对数据中心的利用率,绿色低碳等级,各级别数据中心的电能使用效率都进行了规定。在国家“双碳”和“东数西算”大的背景下,强制性国标《数据中心能效限定值及能效等级》(GB40879-2021)于2021年10月11日正式发布,2022年11月1日正式实施。此标准规定了数据中心的能效等级与技术要求、统计范围和统计方法、测试与计算方法,适用于新建与改扩建的数据中心。
      
      此标准规定数据中心能效等级分为3级,1级为最优。数据中心能效限定值为电能比≤1.50。
      
      2019年12月25日北京市市场监督管理局也发布了《数据中心能源效率限额》(DB11/T1139-2019),并于2020年4月1日实施。此标准规定了数据中心能源效率限额的限额效率指标要求、统计范围和计算方法,并提供了部分节能措施与管理要求。其适用于数据中心中电子信息设备用房面积(不含供配电系统、空调制冷系统等配套用房面积)3000m2及以上或电子信息设备装机总额定功率5000KW及以上的数据中心能源效率的计算、控制和考核。并要求稳定运行一个自然年以上的数据中心其PUE值符合限定值(1.4)的要求;新立项或扩建的数据中心,其PUE值应符合准入值(1.3)的要求;数据中心管理者应通过节能技术改造和加强节能管理,使数据中心PUE值达到先进值(1.2)的要求。2021年7月22日北京市发展和改革委员会印发了《关于进一步加强数据中心项目节能审查的若干规定》的通知,进一步细化了新建、扩建数据中心,年能源消费量小于1万吨标准煤(电力等价值计算,下同)的项目PUE值不应高于1.3;能源消费量大于等于1万吨标准煤且小于2万吨标准煤的项目,PUE值不应高于1.25;年能源消费量大于等于2万吨标准煤且小于3万吨标准煤的项目,PUE值不应高于1.2;年能源消费量大于等于3万吨标准煤的项目,PUE值不应高于1.15。市发展改革部门组织对数据中心实施运行PUE值执行《数据中心能效限额》(DB11/T1139)的情况进行节能监察。对于超过标准限额值(PUE值1.4)的数据中心,将按《北京市完善差别电价政策的实施意见》(京发改[2015]1359号)中超过单位产品能耗限额的情形,确定执行差别电价单位名单,并通知北京市电力公司按月征收差别电价电费。对于PUE>1.4且<=1.8的项目(单位电耗超过限额标准一倍以内),执行的电价加价标准为每度加价0.2元;对于PUE>1.8的项目(单位电耗超过限额标准一倍以上),每度电加价0.5元。2022年5月7日北京市发展和改革委员会与北京市经济和信息化局共同印发了《北京市低效数据中心综合治理工作方案》提出逐步关闭年均PUE高于2.0或平均单机架功率低于2.5千瓦或平均上架率低于30%的功能落后的备份存储类数据中心(主要只汇聚用于冷数据存储、备份数据信息的数据中心)。
      
      2021年4月8日上海市经济和信息化委员会为贯彻落实《关于全面推进上海城市数字化转型的意见》、《上海市推进新型基础设施建设行动方案(2020-2022年)》要求,进一步促进上海市数据中心合理布局和统筹建设,在规划与选址、建筑与配套、规模与功能、安全、节能、报建主体、论证、评估与监测以及边缘数据中心等方面规范数据中心建设发布了《上海市数据中心建设导则(2021版)》,其中规定新建大型数据中心单项目规模应不低于3000个标准机架,平均设计功率不低于6kW,机架设计总功率不小于18MW,综合PUE严格控制不超过1.3;新建边缘数据中心单项目规模应控制在100个机架内,PUE不应高于1.5,平均机架设计功率不应低于6kW。同时综合考虑若干技术对数据中心自身及城市整体能效提升的作用,鼓励技术的有效应用,对若干技术赋予了调节因子。在基准PUE指标基础上计算综合PUE指标,并以综合PUE指标作为导则对各数据中心的约束条件。
      
      二、运维节能需充分利用自身条件
      
      自身条件含自然气候条件、已投用设备情况、数据中心所在建筑的承重与空间,可用资金、业务支持力度等。如:部分数据中心所在地气候条件允许的情况下(如张北地区),当室外空气质量较好、温度适宜时,可以不需要机械制冷,经过简单的过滤(视空气质量脱硫脱硝),将携带冷量的室外空气引入模块机房内,吸收热量冷却IT设备后再排出室外;当室外空气质量较差(尘埃粒子较多或含硫化物、氮化物超标)时,室外冷空气与室内热空气通过换热器(主要有转轮式热交换器或间壁式换热器)进行热量交换,对室内空气进行降温,室内空气通过内循环冷却IT设备。再如:由于数据中心全年制冷,从而提供了在冬季使用冷塔作为冷源的可能性,同时也提供了在春秋过渡季节使用冷塔作为部分冷源的可能性。数据中心通常的运行模式可以分为三种:夏季制冷模式、春秋过渡季模式、冬季自然冷模式(板换或跨跃板换模式)。其中春秋过渡季模式和冬季自然冷模式(板换或跨跃板换模式)均可以充分利用自然冷源制冷。两种运行模式下水循环路径如下:
      
      1.春秋过渡季模式:
      
      冷冻水供回水温度为12-18℃,当室外温度降低,冷却塔出水温度降至低于16℃高于10℃(如14℃)且稳定时,板换提前预冷将冷冻水降温,分担冷机部分负荷的一种运行模式。其冷冻水流程为:冷机部分负荷运行,从末端精密空调回来的18℃的水经由板式换热器降温,使温度小于18℃,如16℃,再由冷机接力降至12℃后供给末端,如此往复循环。冷却水流程为:冷机部分负荷运行,经冷却塔降温后14℃的水先经由板式换热器吸收冷冻水的热量升温至16℃,再吸收冷机冷凝器的冷凝热升温后供给冷却塔再次降温至14℃,如此往复循环。
      
      2.冬季自然冷模式(板换与跨跃板换模式):
      
      冷冻水供回水温度为12-18℃,当室外温度降低,冷却塔出水温度低于10℃且稳定时,使用冷塔作为冷源承担全部热负荷的一种运行的模式。跨跃板换模式是自然冷却模式的一种,当选用闭式冷塔时能够跃过板换将冷冻水冷却水直接串联为机房制冷,板换两侧的2℃温差也将消失,从而延长自然冷却时间。其冷冻水流程为:冷机停机,末端精密空调回来的18℃的水经由板式换热器或跨跃板换降至12℃或以下后供给末端,如此往复循环。冷却水流程为:冷机停机,经冷却塔散热的低温水经由板换或跨跃板换,吸收热量升温后回冷却塔散热,如此往复循环。
      
      此两种自然冷却的方式均充分利用了自身设备条件、建设地气候条件,实现了节能的目的且节能效果较好。
      
      三、运维节能需与运维安全相平衡
      
      在确保供配电、制冷连续性和稳定性的前提下进行节能,并使相关数据符合国家标准以及与业务侧达成的SLA条款。如:《数据中心设计规范》(GB50174-2017)中规定数据中心冷通道温度应保持在18~27℃,冷通道的温度提高有助于压缩机降低压缩比,减少其电力损耗,是节能的重要措施,但是如冷通道控制温度设定在27℃,减少了温度自适应的幅度,将给温度控制提出严苛的要求,同时压缩了故障处理的应急时间,此时就需综合考虑空调系统的自控能力与蓄冷能力,如自控足够优秀、蓄冷时长足够覆盖应急处理时长最终保证制冷的连续性,则可以设置;否则需适度降低冷通道设定温度,如26℃。
      
      再如:不间断电源系统蓄电池最小后备时间按7分钟(柴发作为后备电源时)设计将比后备时间按15分钟(柴发作为后备电源时)设计时,电池容量将大大降低,随着电池容量的减少将降低日常运行中电池充放电、测试、维护放电时电能的损耗,达到节能的效果。但是此设计压缩了市电断电故障应急处理的时间,此时需综合评估柴发启机、并机、送电(即:不间断电源进线电力恢复)的全流程操作时长、运维人员技能水平、系统自动化程度、电池生命周期内容量衰减等因素是否满足连续供电要求,是否存在柴发启机或并机故障的可能,此故障发生后手动操作总时长是否会超出7分钟(或电池生命周期内衰减后时长)。如不超过7分钟,能确保供电的连续性,则可以按7分钟设计;否则需相应的延长电池后备时间。
      
      四、运维节能需与设备冗余相平衡
      
      适当减少投用的备份设备数量,往往是有效的节能措施之一,此时需均衡冗余度与节能管理的关系,需评估冗余度与业务稳定性的关系。如:相同IT负载时,不间断电源(UPS或HVDC)的投用数量越多其负载率越低、损耗越大,在低负载情况下,减少不间断电源的投用数量可以降低其损耗,提高运行效率,实现节能,此时需综合考虑此操作将造成热备的设备减少,如单台或单模块发生故障,与其匹配的另外一路电源中断,非故障设备或模块的承载力是否满足安全运行的要求。
      
      某数据中心使用某品牌UPS作为IT电源,总计64台,单台容量600KVA,每4台一组并机,均为2N配置。在数据中心投用初期机房负载率较低,UPS负载率最高一组为21%。根据此型号UPS效率曲线,负载率较低时其效率较低,负载率较高时其效率较高,为达到节能减排的目的决定关闭部分UPS,提升负载率。经计算现场负载率为21%时,关闭一台UPS后其余三台并机,负载率上升至28%,自身损耗由7.35%下降至6.1%,同时满足供电系统2(N+1)配置,满足运行安全的要求。此时数据中心IT总负载为8000KW,损耗率降低1.25%全年节能为876000kwh,节约标准煤107.7吨(当量值),减少二氧化碳排放529.1吨。综合考虑UPS机组每台运行时长、老化率、电池寿命、检测与排除故障需求、人员培训的需要等因素最终决定此负载率下UPS轮循运行,倒机操作每15天进行一次。
      
      五、运维节能需注重资源的平衡利用
      
      大多数据中心主要使用的资源为电力,柴油、天然气、水等,这些资源间会存在相互影响或转换的关系,数据中心运维过程中应从总体节能的角度做好资源平衡利用的测算。如:风冷直膨空调,冷凝器侧使用水喷雾,通过蒸发吸热降低周围空气温度和冷凝器温度,可以有效降低冷凝器风扇及压缩机的耗电量,此时需综合考虑数据中心所在地水资源情况、水资源政策以及耗水量与节电量的经济效益。
      
      再如:使用分布式燃气发电能源站(三联供)的数据中心,能实现天然气的综合利用,同时供电、供冷、供热,此时天然气的使用量越大外市电的消耗量越小、制冷系统耗电量也将大大减少,此刻需计算天然气与电力消耗的关系和相关收益,同时考虑天然气的资源情况与政策。
      
      六、运维节能不可因局部破坏整体
      
      局部问题往往付出较小的代价便可以解决,此时不宜采用整体性策略,造成能源的整体浪费来实现局部问题的达标。如:使用房间级冷却系统的数据中心机房模块里往往会在标准机柜中夹杂几个高功率机柜,高功率机柜要求有更高的制冷量,一般数据中心机柜内IT设备为空气冷却,提高制冷量的途径有增大风量和降低空气温度两种方式,此时如果为消除仅有的几个高功率机柜散形成的局部热点,降低整个机房模块冷通道温度或者提高所有精密空调的风量,那么其他区域将会过冷,存在能源浪费的问题,不利于节能。此时需采用的方式可以是在高功率机柜附近补充列间空调提供更低温度的空气或在其送风位置增加强制通风措施,以加大高功率IT设备的通风量。
      
      七、运维节能相关的改造、变更需与业务时间窗口相匹配
      
      数据中心的任何改造变更都存在一定的风险,在做好方案评估、风险排查、应急预案、方案审批工作的同时,仍需和业务时间窗口相匹配,用底限思维,确保发生意外时对业务端无影响或影响最小。在与业务侧共同确定变更时间后,如条件允许业务侧人员可以利用其他备份机房进行主备转换或在出现风险时进行业务切换,确保业务安全。
      
      八、运维节能技术选择宜经过相关验证或有相关案例
      
      运维节能工作的开展均是在运行数据中心内进行,各项节能技术或措施的采用直接关系着运行的安全与稳定,所以进行选择时应尽量选择成熟的节能技术、有相关的案例参考,汲取成型案例的改造、建设、运行经验。在自身应用时也需先试点,试点时间建议为1年即经历春夏秋冬,观察各气候条件下的运行安全性、稳定性和节能效果。
      
      如:在应用风冷直膨空调冷凝器侧水喷雾技术时,初期使用自来水作为喷雾水源,运行1年后冷凝器外表布满水垢,大大降低冷凝器散热能力,使本应节能的技术变为负担,增加能耗,空调高压报警频繁,造成运行风险。此时就需在清理完冷凝器水垢后改变喷雾水源,使用纯水,重新进行耗水量与节电量的经济效益分析。
      
      九、运维节能需注重点滴积累
      
      “泰山不拒细壤,故能成其高”,数据中心中的节能工作应“不以善小而不为”,日常运维过程中需注意节约点滴的能源,点滴的能源节约经不断的积累将成为一个可观的节能量,达到“集腋成裘”的效果。如:某数据中心柴发水套加热器根据供暖周期进行开启(每年11月15日至次年3月15日),其余时间全部关闭。每栋机房共8台柴发,每台柴发配置2个电加热器,每个电加热器的额定功率为6.5Kw。电加热开启数量参考机房楼实际负载,根据N+1的原则进行开启。根据此运行策略此数据中心每年可节能299520Kwh,节约标煤26.81吨(当量值),减少二氧化碳排放180.9吨。
      
      十、运维节能需处处留意、注意细节
      
      运维节能工作需注意细节,善于思考,利用节能理论指导节能实践。如:某数据中心在雨季,机房会出现高湿状态,此时恒湿机开启除湿模式,增加能耗,在机房内各因素无明显变化的情况下,可判断为外部湿空气侵入导致。经查弱电、强电、空调各专业孔洞均已封堵无明显漏风现象。之后经对机房进一步排查发现因消防排烟风道在房间级空调回风区,此处为负压环境,室外空气通过此管道侵入机房,造成高湿。后经专业消防单位改造,将风道风口位置移离负压区后,机房内高湿状态得到明显改善。从而降低了除湿能耗,达到了节能的目的。
      
      十一、运维节能工作需考虑综合用能
      
      数据中心在运维过程中需考虑综合用能。如:某数据中心园区包含办公楼、研发楼、宿舍楼等公共设施,在冬季需要进行采暖。传统供热方式为通过连接市政供热管网或自建燃气锅炉房供暖,数据中心因有大量低品位热量需要散失到大气中,采用水源热泵技术从数据中心冷却用水中提取热量,为公共设施供暖,从而减少了市政供暖公司或燃气
      
      锅炉房的耗能,可以实现节能减排的目的。再如:提高数据中心风电、光电、水电等绿色电力的使用比例,减少火电用量,也实现了二氧化碳的减排目标。
      
      十二、运维节能投入需与回报相匹配
      
      数据中心投用某项节能措施前需核对其回报,确保此投资与回报在可接受范围内。如:在采用冷却塔并联系统的数据中心内,冷却塔负载上升到一定程度后,适量投运备用冷却塔可以增加散热面积降低冷却水下塔温度,冷却水水温的降低会减小压缩机压缩比,降低制冷机组能耗。但此时应该综合考虑测算新开冷却塔增加的耗电量、维护成本等与制冷机组节能量的大小,确定为正收益方可实施。
      
      参考文献
      
      [1]《数据中心能效限定值及能效等级》(GB40879-2021)中国标准出版社,2021年10月第一版
      
      [2]《数据中心节能技术与应用》,张泉、李震等,机械工业出版社,2018.6
      
      [3]《数据中心制冷系统设计时需注意的几个问题》,岳仁杰,建筑工程技术与设计,2019(14)
      
      作者简介
      
      岳仁杰,就职于北京光环新网科技股份有限公司,本科,工程师,从事数据中心基础设施设计、运行维护、能源管理。
      
      谷卓林,就职于北京光环新网科技股份有限公司,本科,从事数据中心电气架构设计、基础设施运行维护。
      
      李斌,就职于北京光环新网科技股份有限公司,硕士,工程师,从事数据中心空调系统设计、运行维护、能源管理。
      
      编辑:Harris
      
      

  •