咨询QQ:
      杂志订阅

      编辑

      网管

      培训班

      市场部

      发行部

电话服务:
 010-82024984
 010-82024981
欢迎, 客人   会员中心   帮助   合订本   发布信息
设为首页 | 收藏本页
数据中心全生命周期运营管理的数字化之路
  • 数据中心全生命周期运营时间长、管理对象多、原始管理记录巨大,并且挖掘和充分应用运营管理信息对数据中心运营极为重要,因此非常有必要借助于现代信息技术对数据中心全生命周期运营管理进行数字化转型。
  • 结合了业内的部分实践经验,我们整理出数据中心全生命周期运营管理的数字化转型的功能框架参考模型(见图1)。
      
      1 电子化过程
      
      实现数字化转型首先要使用电子化手段实现运营管理信息的数字录入,即把数据中心全生命周期运营管理基础信息的进行电子化信号采样。采样对象主要包含运营管理对象、行为、需求、组织和制度,采样频率、采样内容均以运营管理的需求为准。
      
      (1)管理对象电子化
      
      数据中心全生命周期运营管理对象有资产(有形资产和无形资产,如设施和设备、工具、软件等)和资源(各种运行资源,如人员、水、电、机柜空间等)两类。管理对象电子化过程是指对数据中心资产和资源的运行环境、运行状态、运行指标等因素进行了用于存储和处理的数字信号采样的过程。
      
      部分数据中心设计采用了智能化的设施和设备,且多数数据中心都配置有动环管理系统/DCIM、BA/BMS等,它们在资产对象电子化管理上实践经验较丰富,但对资源对象的电子化管理实践深度依然不足。总体来看,数据中心全生命周期运营管理对象的数字化过程还需要进一步完善。
      
      (2)运营行为电子化
      
      运营行为包含运营操作行为和运营管理行为。运营操作行为是指人或智能设施有目的的实施的物理或逻辑动作。常见的运营操作行为如工程实施、验收、维护、巡视等。运营管理行为是指运营管理人员为实现某一运营目标而执行的一系列措施组合,常见的运营管理行为如规划设计管理、业务管理、运维管理、行政管理等。
      
      运营行为电子化过程就是对运营操作和管理行为的目的、职责、权限、审核、执行前提和环境、准备、步骤、执行程度、间隔、频率等代表该运营行为关键信息,进行可用于存储处理的数字信号采样的过程。
      
      对运营行为的电子化过程属于新兴领域,近年越来越多的数据中心运营组织正在探索和制定针对运营行为电子化的相关规范。运营行为电子化过程是数据中心实现卓越运营管理的基础。
      
      (3)运营需求管理电子化
      
      运营需求的满足程度代表着运营商业价值的呈现度,数据中心运营管理需要做好对运营需求的管理。运营需求包含的组织机构的战略目标需求、运营项目价值定位需求、项目效益需求、项目质量需求、服务承诺协议SLA等。
      
      运营需求电子化过程是以电子化形式对数据中心运营的相关需求进行归类、要素提取、整合、逐级分解、量化、定责、确定时限等,并提供了对组织、监视、控制、评估整个需求管理过程进行电子化转化的行为。
      
      运营需求电子化过程虽然非常重要,但因分解和量化等过程需要利用实践经验反复论证和完善,实施起来异常艰难。目前业内部分行业领头的数据中心正在进行积极探索和尝试,但还未有效形成行业规范。
      
      (4)运营组织和职责电子化
      
      运营组织是行使数据中心运营管理任务的执行主体,组织岗位职责是运营组织的重要属性。通过对运营组织及其职责的电子化转化过程,让电子化转型后的数据中心全生命周期运营管理真正能够运作起来。
      
      运营组织和职责电子化过程在企业或其他组织机构的传统管理领域有广泛的实践应用,因此当前有部分数据中心运营管理团队计划直接使用。但实际上考虑到数据中心运营管理领域还是存在自身的独特性和专业性,建议需要对传统的应用经验进行优化后再予以执行。
      
      (5)运营流程和制度电子化
      
      运营流程和制度用于指导运营组织遵循一定的规则和规范来行使运营职责。流程是指由完成一个业务行为的步骤和过程,包含进行过程中的顺序。制度是指要求组织机构所有成员共同遵守的办事规程或行动准则。在数据中心运营管理时,通常用制度来定义运营团队的工作责任和义务范围;同时用流程指导运营团队怎么去完成这些工作责任和义务。
      
      运营流程和制度是结合运营组织和职责共同实现电子化过程的,其实施成果主要呈现于对运营组织和职责的赋能、界限、增加时间属性、定义执行次序等,让运营组织在以授权范围内按照受认可的规范来执行特定的运营功能。
      
      2 通用格式规范化过程
      
      (1)规范运营管理的通用语言格式
      
      运营管理采用特定的商业语言来表述和传递业务信息的,为了便于运营管理部门之间能够清晰理解所有的业务信息,需要对运营管理信息格式进行规范,形成通用语言格式,通用语言格式是一种逻辑语言格式。规范通用语言格式需要足够的调研和分析,使其在组织机构内部具有足够广泛的代表性。
      
      (2)规范电子承载平台的通用标准
      
      电子化应用涉及到各种承载平台,如运行、计算、存储、传输、呈现的平台系统。应规范电子承载平台的核心功能,避免平台差异给运营管理业务带来影响。
      
      因此,电子承载平台应进行统一规划,控制同功能平台的类别数量,并优先选择主流平台系统;因创新而必须采用非主流平台时,应先充分论证承载平台之间的衔接。
      
      (3)制定电子信息的数据结构规范
      
      除了使用规范的通用语言格式,在进行电子信息的录入、计算、存储和展现时,数据中心运营还需要制定信息的数据结构规范,定义好电子信息的组成结构、规范信息要素的命名规则和含义,使各个业务处理环节能够准确理解和调用电子信息,完成整个运营管理工作。
      
      (4)规范电子化管理信息的接口格式
      
      数据中心运营管理工作需要组织机构内外的其他业务之间存在着众多的业务互动,由于其他业务域的系统可能采用了不同的电子信息标准,因此,数据中心运营管理电子化过程还应同时考虑跨域系统之间的电子信息交互接口的规范化,包括定义接口的使用途径、方法、格式、性能等。
      
      3 数据方舱
      
      数据方舱承载原始运营记录和对原始运营记录进行处理后的结果,它负责对这些电子信息进行存取、安全和性能管理。数据方舱应包含有以下几个主要功能:
      
      (1)数据流向管理
      
      数据方舱应对数据流向进行规范管理,根据各种电子信息的生成、处理、交互、存储需求,组织、记录、规划和引导整个数据中心运营管理业务域内的数据流向,以便进行数据的安全、空间和性能规划管理。
      
      (2)数据安全管理
      
      数据方舱应对数据的安全规划负责,采取必要的措施(和设施)来确保在生成、传递、存储、处理过程中,电子信息是完整、可信、不被窃取、不被恶意消除、授权使用、可审计的。
      
      (3)存储空间管理
      
      数据方舱应收集管理所有的电子信息存储需求,主动识别需求的合理性,完成对存储电子信息空间需求的优化,并统一规划和建设信息存储支撑平台。存储空间应能同时满足当前运营业务的需求,同时兼顾到未来空间扩容的平滑过渡性。
      
      (4)处理性能管理
      
      数据方舱应选择合适的存储方案,确保电子信息存取和处理过程的吞吐性能能满足运营管理工作的需求。不盲目追求超高性能,而是确保性能需求与投资和运营代价之间的合理平衡。
      
      4 信息处理机制
      
      信息处理机制包含各类信息处理引擎,负责对原始运营记录进行不同等级的加工处理后向应用系统输出。信息处理机制常见功能包含:
      
      (1)组织
      
      对数据中心运营管理的所有电子信息有目的、有计划地协调起来,通过分享、筛选、归纳、关联、挖掘、学习等步骤让信息的商业价值得到充分地体现。
      
      (2)共享
      
      对数据中心运营管理所有相关电子信息按照预先约定的授权进行分享,发挥出运营管理信息的最大商业价值。
      
      (3)筛选和归纳
      
      按照一定的规则条件,如用途、价值等,屏蔽掉重复、无价值、非授权、非法的运营管理信息,并根据类别、含义、数值分布区间等对已筛选数据信息进行归类、统计和汇总。
      
      (4)关联
      
      根据信息的属性识别和标示出运营管理信息之间的起源、时间顺序、因果关系、制约关系、并发关系等互相影响的联系。
      
      (5)挖掘和学习
      
      挖掘和学习是指尝试模仿人的意识和思维,基于已知的经验和知识对运营管理信息进行加工、推理和判断,并不断优化已知经验和知识的过程循环。
      
      5 呈现层
      
      运营呈现环节用于辅助数据中心运营团队执行日常性基础事务,包含有还原、监控、输出和展现4个核心功能环节。
      
      (1)还原环节
      
      还原环节指对原始运营记录进行处理,并组合成有逻辑意义的运营事件与过程。运营事件可用于监控运营的行为细节,运营过程可用于评价运营质量和风险。
      
      (2)监控环节
      
      监控环节指在可能会影响运营质量的关键环节(或关键属性点)上,对运营事件与过程的状态进行必要的连续追踪,并在状态超出特定条件时,适时采取必要手段向相关运营责任部门提出告警信息,责成其进行及时处理。常见的监控系统有:动环监控系统、安防监控系统等。
      
      (3)输出环节
      
      输出环节指在特定周期内,将事件与过程的还原和监控情况进行分析和总结后,以约定的格式和内容,主动向获得授权的相关运营管理方呈送的行为。常见的输出如运营月报或季报等。
      
      (4)展现环节
      
      展现环节将初步分析后的事件与过程监控情况,实时向特定区域进行公开展示的行为。例如在监控中心或参观通道的大屏幕投放实时运行状态数据等。展现系统既用于向运营值班人员提供直观的状态监控,也给其他业务部门或访客提供了了解数据中心运营的途径,提升业务形象。
      
      6 运营经验库
      
      经验指运营管理团队在执行数据中心运营管理工作的实践过程中,通过总结获得关于数据中心运营现象及外部联系的认知。经验有待于深化并上升成为理论知识。运营经验数据库是协助运营管理团队来完成累积、归纳、使用运营管理认知的辅助平台。
      
      (1)规律
      
      运营规律是指运营管理团队已认知的数据中心运营现象及其外部联系,规律在特定环境下是可复现的。规律库可以帮助运营团队完成数据中心运营管理的规划,在运营过程中规避已知运营风险,同时优化运营的效果。
      
      (2)教训
      
      运营教训是对数据中心运营管理中“不可为”管理行为的总结。是运营管理团队以某种损失代价换取回来的运营管理经验。教训属于“高代价”的认知,也具有很高几率的可规避特性。因此,运营管理团队应特别重视推动运营教训在实际工作中的应用。
      
      (3)心得
      
      运营心得是对数据中心运营管理中“建议为之”管理行为的总结,属于可复制的运营管理成功经验,是数据中心进行运营优化的基础。
      
      (4)创新
      
      运营创新是关于运营管理的新构思和新方法,运营经验库是通过对创新实践的得失进行管理和总结,来促进部分创新转化为成功的运营驱动因素。
      
      7 运营标尺库
      
      标尺库是以本组织机构的数据中心运营经验为基础,结合业内标准与规范,经过理论升华后提炼出来的适用于本组织机构的通用运营基准。运营标尺库可用于数据中心运营规划的目标,也可用于运营成果的评估依据。运营标尺库通常包含以下方面:
      
      (1)体系基准
      
      体系是指数据中心不同的运营管理系统和因素,按照一定的秩序和内在联系组合而成的运营整体。体系基准则为数据中心运营管理指引了搭建管理体系的目标,并为管理体系内部元素的组成、秩序和内在联系提供了整体框架建议。
      
      (2)标准集
      
      运营标准集是在运营管理体系建议框架下,为数据中心运营操作、系统运行、管理体制等方面如何细化落地提供一系列的实施建议,同时也可作为运营实施成果的评价基准。
      
      由于运营标准集覆盖领域广,容易出现重叠、遗漏、不够详细等现象,因此需要持续地进行维护和更新。
      
      (3)行业标杆
      
      组织机构选择可类比的、处于市场领先地位的数据中心作为学习榜样,这个参考榜样就是行业标杆。由于业务类型和自身发展环境有差异,不同组织机构选择的行业标杆可能会不同。
      
      组织机构通过与行业标杆进行优劣势分析对比,找出自身数据中心运营管理的差距所在,据此提出切实可行的优化方案建议,以实现向行业标杆对齐,提升了自身运营管理水平。
      
      (4)评价机制
      
      数据中心运营需要一套评价机制,对数据中心的运营体系建设、运营标准执行、行业标杆对齐等方面的情况进行评价,以判断数据中心运营是否达到预期的效果。运营评价机制包含专项评价指标(如运营KPI、SLA等)、资质认证(如ISO认证、UPTIME认证等)。
      
      作者简介
      
      覃春江,维谛技术数据中心服务产品部高级经理。主要从事数据中心的设计、运维规划和咨询工作,有多年数据通信和数据中心基础设施从业经验,重点关注客户的全生命周期运营、快捷部署、安全运维、能耗管理方面的诉求。
      
      编辑:Harris
      
      

  •