透过汶川地震看BCM价值

计算机用户 2008年7月14日 王占波 石菲

 

未来会发生什么,我们没有把握准确地预期,但是,我们每一个人都有义务对此做好充足的准备,在风险到来的时候,把损害降到最低。

 

汶川大地震不仅震塌了楼房,也惊醒了人们对信息化系统的思考。中国信息安全测评中心常务副主任王贵驷在最近的一次国际讨会上认为,我国的灾备中心布局上还有不合理的地方,存在一定的安全隐患。


分散的应急预案,到紧急情况都用不上

刚从成都来京的刘勇关注的核心就是灾备管理。他介绍的地震期间的真实情况让大家为国内灾备管理的不足感到痛心。作为成都市信息办主任,他现在正忙于成都市灾后信息的规划与重建。地震期间,他则一直负责一线指挥。地震发生后,不仅部分灾区通信基础设施遭到严重损毁,成都市全市通信也一度瘫痪。城市的应急调度指挥与通信指挥的问题凸显出来,主要表现在公众通信的基础设施抗毁的标准低,严重依赖于外部条件的正常保障。

刘勇当时正在一线救援,负责一线现场通信保障,他不得不和公共通信运营商反复沟通。中国移动在当地有4700多个基站,当时损毁了2300多个。尽管运营商们反复表示基站恢复了不少,通信却一直不能正常使用。经过调查,后来才发现,原来是基站的功能恢复了,但是运行没有恢复。灾区没有电,基站不能运行。没有办法,只有去找油机,找到油机以后又找油,找到油以后却没法运送。在当时那种紧急情况下,道路交通的管理都成了大问题。作为当地的信息主管部门负责人,刘勇好不容易找来的运送油料的保障车辆却根本无法通行。

通过这次地震,刘勇感受到成都市信息化建设有待进一步完善。核心一点就是基于通信保障的灾害预防、应急救援、容灾管理以及灾难恢复等技术体系、运行体系及响应机制都没有建立起来,过去包括分系统、分领域和分部门制定的应急预案,到紧急情况都用不上。问题归结到一点,就是我国在面临地震等灾难爆发时刻,应急管理制度和体系仍有很多不足。

 

灾难成为反思应急管理的镜子

灾难是一所学校。汶川大地震带给人们沉痛的悲伤,也为我们反思提供了一面镜子。以美国为例,美国的应急管理系统也是伴随着灾难教训而诞生的。20世纪70年代,加利福尼亚首先建设了灾难指挥系统。在北京召开的中国灾备管理战略国际研讨会上,国际灾难恢复组织(DRII)主席John B. Copenhaver说,出现这套系统的起因是出现了一些沟通和协调的问题。当时加利福尼亚地区发生了一次大火,在大火的管理当中,一些问题暴露出来。应急管理出现的一些失误主要是由于整个指挥和控制结构出现的问题,没有很明确的架构。为了应对加利福尼亚的大火灾难,加利福尼亚地区就建立了灾难指挥系统。通过这套系统,不同的机构和部门,大家都一起来进行合作,在统一的这种灾难或者事件的指挥系统下来进行工作,进行事件的管理。根据灾难紧急支援功能来建立起来的这套系统,它已经成为一个标准。

在面对可能导致业务中断的意外事件或者重大灾难时,保持业务的持续运营,是对任何组织的基本要求。行政机构如此,在现今的商业社会,任何经营性的公司运作也是如此。任何的公司作业和商务往来都要讲求高效率的运作和有效的管理。比方说一个以网络为基础的金融机构,如果系统发生故障,24小时没有办法开展业务,它们就有可能彻底消亡了。为了保持持续运营,需要开发业务持续管理(BCM),这也成为了一个公认的商业准则。

提及BCM时,人们首先想到的是信息系统的灾备计划,这是正确的逻辑,因为IT系统至今仍然被认为是最具不确定性的支撑。但是,BCM绝对不仅仅是一个灾备方案,国际业务持续协会(The Business Continuity Institute)在2007年的《最佳实践指南》中把它定义为“一个整体性的管理流程,它能识别对组织构成威胁的潜在冲击,提供一个建立快速恢复能力和有效反应能力的框架,从而保障组织的利害相关人的利益,组织的名誉、品牌及创造价值的活动。”

这意味着BCM的管理需要放到整个企业的管理框架中,它的实施和管理需要企业的高级管理层直接参与和负责。不是一个一次性的项目,BCM实施需要考虑的方面,也不仅仅是信息系统,而是要从场地、人员、技术、设备、供应链甚至包括上下游企业等方方面面来考虑,而灾备计划主要由IT部门来负责组织和实施。

如今,社会协同作业成为主要的商业模式,一个公司不可能囊括所有的职能部门,由此产生了巨大的商业供应链体系,世界各地大型组织和企业都越来越重视供应链的管理,并且在管理和确保供应链的顺畅供应方面投入巨资,以达到企业自身的要求。

因此,在发生问题时,我们所要解决的,也绝不仅仅是公司内部的问题,而是整个生态系统的问题。因此,高层管理者对BCM的大力支持、组织把BCM融入企业日常运营管理中、各阶层的员工给予BCM的全面配合等,都是一个高效的BCM体系不可或缺的要素。

Unisys全球公共事业部大中华区总监秦峰表示,一个有序的灾难恢复/业务准备方案应该包括数个步骤,首先企业要进行一个全方位的风险评估,由专家作出客观评定,研究企业IT系统应对各种风险的韧力,同时探讨如要作出改进,这对人力配置及业务程序方面带来哪些影响。

企业要在大型灾难发生后短时间内全面恢复业务运营并不容易,因此应该对各个业务程序的优先次序作出规划,关键任务首先恢复,其它陆续到位,这先后有序的方法较为实际。

GDS公司副总裁汪琪则认为,真正要做到一个企业的业务连续,最基础的是信息系统的备份和恢复,这在全世界都一样,所有的企事业单位都是从自己的数据和信息系统开始考虑。在这个基础上,业务连续规划的着眼点从IT转向了业务。考虑到对紧急事件应急的处置、响应,对企业和部门在这种紧急情况下的危机的管理,媒体公关的应对,合规性的管理以及我们在整个供应链的链条上下游等这种关联的管理,就是整个业务连续的管理。

 

防患于未然

美国“9.11”时期,曾发生过这样一个案例。当时美国双子座大厦上有一家传统的司法领域的事务所,这是一家比较保守的事务所,他们强调传统的物证,对信息化不够重视。伴随着撞机事件的发生,那个事务所一蹶不振,彻底关门。从灾难恢复到业务恢复,进而到业务恢复管理,这是一种认识的进步,更是实践经验的总结。

中国的“危机”一词有两种含义:危险和机会。灾难无疑是危险的,但通过对灾难的认知、分析,进而提高灾备管理水平,对于国人而言,也未尝不是一个机会。未来会发生什么,我们没有把握准确地预期,但是,我们每一个人都有义务对此做好充足的准备,在风险到来的时候,把损害降到最低。这也正是BCM的价值所在。