业务连续性管理有章可循
《中国计算机报》 郭涛 2007-08-27
今年8月,全球首个业务连续性管理框架BS25999将成为正式标准。企业可依据此标准建立BCM管理框架,以便在灾害发生时能从容应对,在灾后能尽快恢复。
今年3月初,我国东北地区出现的一场暴风雪,曾经一度导致供电系统中断。对于那些数据中心位于停电区域的单位来说,当时的情况非常紧急。“我们几乎要启动灾备预案了,好在两个小时以后供电恢复了。”一位保险公司的信息主管事后表示。面对随时都有可能发生的人为或自然灾难,企业必须做好数据备份、系统恢复及业务连续性管理(BCM)。
灾难恢复先行
灾难恢复并不只是信息技术部门一个部门的事,应该引起企业高层管理人员的重视。2005年,国务院信息化办公室出台的《重要信息系统灾难恢复指南》(以下简称《指南》)对于促进我国行业用户实施灾难恢复计划起到了积极作用。近两年,银行、电信、证券、保险、民航、铁路、税收、海关等许多行业,在灾难恢复的规划和实施方面取得了丰硕成果。据预测,2006-2008年,我国灾难备份市场将进入快速增长期,业务连续与灾难备份市场规模将接近百亿元,各行业用于信息安全及灾难恢复方面的投入将呈稳定增长态势。IDC的分析师认为,各存储厂商在业务连续性管理领域的投入也将在2007年得到回报。
《指南》虽然只是一个指导性文件,但它的操作性非常强。从灾难恢复规划的管理、灾难恢复的需求分析、灾难恢复等级的确定、灾难恢复等级的实现,以及灾难恢复预案的制订、落实和管理等方面,对灾难恢复的规划进行了全面描述,为企业实施灾难恢复计划提供了权威参考。据记者了解,《指南》经过不断完善,很有可能在未来一两年内成为国家标准。到那时,企业的灾难恢复计划将真正有章可循。
灾难恢复事件时间图
构建BCM管理框架
当灾害发生时,如何才能保证各项工作有条不紊地进行,并把损失降到最低呢?GDS万国数据服务有限公司副总裁张权表示:“《指南》是目前国内行业灾难恢复方面唯一的政府指导性文件,操作性非常强。但是,对于企业来说,如何保证自己的灾难恢复工作是否考虑全面,并且如何向客户证明自己实现了完备的业务连续性管理呢?BS25999从国际标准认证的角度,为灾难恢复与业务连续管理提供了第三方认证的方式。对于行业来说,是一个非常重大的事件。”
今年8月,全球首个业务连续性管理框架BS25999将正式成为认证标准。BS25999不仅为构建BCM提供了指导性方向,而且作为一个灾难恢复的国际标准,意味着这个行业更加成熟,并且得到了广泛的重视。
BCM管理流程图
张权介绍说:“BS25999把BCM归纳为六个组成部分,即理解组织、制定BCM战略、开发并实施BCM响应计划、BCM管理程序、把BCM植入企业文化,以及演练、维护和评审回顾。参考这六个步骤,企业可以建立自己的BCM管理框架,以便在灾害发生时能从容应对,在灾后能尽快恢复。”
理解组织
理解组织需要用到业务冲击分析(BIA)和风险评估(RA)等工具和手段,找出关键服务及其依赖因素所能容忍的损失,主要包括分析企业自身的业务和所依赖的业务环境,找出关键服务/产品及其依赖因素(资源、资产、活动等),以及识别出该关键活动所能容忍的中断时间及业务所能容忍的最低服务水平等。
制定BCM战略
采用适当的控制措施,降低威胁发生的可能或者发生之后的影响;考虑预定的弹性恢复机制和缓建方案;在事件发生时和发生后,提供关键活动的连续性;分析那些尚未被识别为关键活动的部分。
开发并实施BCM响应计划
当灾难事件发生后,可以把后续的过程分成三个阶段来看待:首先是应急响应阶段,从灾难发生的几分钟到数小时之内;其次是业务持续阶段,在灾难发生的数分钟到数天之内,根据预先的准备,在一定程度上保持业务,并启动恢复的计划;最后是恢复阶段,在灾难发生几周到几个月的周期内,按照预先的准备,把业务全部恢复到原来的水平。
演练、维护和评审回顾
理想的演练方式应该是在真实环境下进行全盘演练。在资源有限的情况下,企业也可以进行模拟环境演练。对于一般性的业务,企业也可以采用排练的方式演示计划的可操作性。此外,企业还应对BCM计划进行定期评审,发现问题后及时调整和改进。
BCM管理程序
上述四个步骤是对BCM构建项目的管理,需要调动资源、制定日程、跟踪策划和实施状况,但更重要的还是BCM管理程序,要让BCM理念深入到每个相关人士的头脑中。
把BCM植入企业文化
通过相关技能的培训,加深企业管理层对BCM的理解和认知。当BCM融入企业的核心价值观中时,BCM的管理才能更加高效。
BCM管理是需要企业高层推动的。一个好的BCM管理框架能够让企业有足够的弹性来应对不同的事件。
