告别数据丢失 容灾刻不容缓
《中国计算机报*存储世界》 2006年第4期 GDS万国数据


自从有了信息技术以来,信息系统面临的各种灾难和故障就从来没有停止过。随着信息系统的重要程度和关键性的提高,如何保障信息系统对关键应用的服务等级和服务品质,成为日益急需解决的问题,为此,灾难恢复工作已刻不容缓。信息系统灾难恢复的目的是提高信息系统抵御灾难和重大事故的能力,减少灾难打击和重大事故造成的损失,减轻对单位和社会带来的不良影响,保证信息系统所支持的关键业务功能在灾难发生后能及时恢复和继续运作。


时机已经成熟


灾难恢复于七十年代中期在美国起步,在这以后的三十年里,美国的灾难恢复行业得到了迅猛发展。在国内,各行业用户对信息安全的建设越来越重视,其投入也呈现稳定增长的态势;但就单位信息化来说,大部分单位还没有有效的灾难恢复策略,没有建立统一的业务连续管理机制。


20世纪90年代末期,一些单位在信息化建设的同时,开始关注对数据安全的保护,进行数据的备份,但当时,不论从灾难恢复理论水平,重视程度,从业人员数量质量,还是技术水平方面都还很不成熟。


2000年,“千年虫”事件引发了国内对于信息系统灾难的第一次集体性关注,但“9.11”事件所引起的震动真正地引起了大家对灾难恢复的关注。随着国内信息化建设的不断完善、数据大集中的开展和国家对灾难恢复工作的高度重视,越来越多的单位和部门认识到灾难恢复的重要性和必要性,开展灾难恢复建设的时机已基本成熟。21世纪初,国内灾难恢复专业服务商的出现以及灾难恢复外包和咨询项目的开展标志着国内灾难恢复市场的起步。中国的灾难恢复建设在经历几年的探讨之后,正逐步进入实践阶段。各地方政府和行业监管部门也在积极行动,制定灾难恢复的指导性意见,各单位开始计划或正在建设灾难备份中心。


八大行业先行一步


2003年,中共中央办公厅、国务院办公厅下发了《国家信息化领导小组关于加强信息安全保障工作的意见》,文件要求:要高度重视灾难备份工作。为贯彻落实中央的指示,国务院信息化工作办公室于2004年9月份下发了《关于做好重要信息系统灾难备份工作的通知》,文件强调了“统筹规划、资源共享、平战结合”的灾备工作原则。为进一步推动八个重点行业加快实施灾难恢复工作,国务院信息化工作办公室于2005年4月份下发了《重要信息系统灾难恢复指南》,文件指明了灾难恢复工作的流程、灾备中心的等级划分及灾难恢复预案的制定,使得灾难恢复建设迈上了一个新的台阶。


目前,国家部委、地市政府、银行、海关、税务等行业已经开展了灾难备份中心的设计、规划与实施。如:深圳市已经开始建设灾备中心,北京市、上海市、广州市、杭州市等地方政府正在研究建设灾备中心;海关总署目前已建成灾备中心,商务部的灾备中心正在建设中,税务总局、民航总局等单位的灾备中心正在计划中;中国人民银行已在无锡自建了灾难应急备份中心,三家政策性银行也都有建设灾难备份中心的考虑,深圳发展银行租用第三方的灾备中心已稳定运行4年,中国工商银行、福建兴业银行等单位目前已建成灾备中心。


问题不少


同时,国内的灾难恢复工作还存在一些问题。部分单位对灾难恢复建设的概念模糊,混淆了数据备份、灾难恢复和业务连续性的区别,存在侥幸心理,缺乏开展灾难恢复工作的积极性;在没有统筹规划的前提下各行业及地方自行建设灾难备份中心,必将产生重复建设的情况,造成社会经济资源的分散和和浪费;从事灾难恢复建设和服务的企业良莠不齐,部分企业缺乏专业化能力,所提供的建设方案不能满足灾难恢复的要求,不具备保证灾难恢复和业务连续性能力;灾备中心应付灾难的能力必须通过不断的演练来提升和完善,目前已建成的灾备中心普遍缺乏严格的演练,灾备中心的运营缺乏有效的监管和审计,导致大量的灾备中心无法在灾难来临时有效发挥作用。


为此,如何选择灾难恢复建设模式?如何选择灾难恢复服务提供商以便降低外包风险?如何选择和建设灾难备份中心?这些成为我们日益关注的问题。下面就以上问题进行探讨,希望给读者有益的启示。


灾难恢复建设模式


灾难恢复建设的方式主要有三种:自建、共建和外包。自建是指单位自己拥有并操作灾难恢复设施,有自己的灾难恢复运营和管理团队。共建是指多个单位共同出资建设灾备中心,在这些单位内部互相提供灾备服务。外包是指单位选择外部专业技术与服务资源,以替代内部资源来承担灾难恢复系统的规划、建设、运营、管理和维护,比如租用灾难备份场地、设备,将灾备运营维护交于灾难恢复服务商、服务商协助应急恢复等形式。


灾难恢复建设投资巨大,并且使用概率较低,因此,需要根据自身实际情况,对灾难恢复建设的总体投入成本(TCO)和投资回报率(ROI)进行认真分析和计算从而确定灾难恢复资源的获取方式。结合中国国情,对灾难恢复建设的不同模式进行简要分析,三种建设模式的优缺点比较见下表:

 
优点
缺点
适用单位
自建
单位专用;所有决策都由单位自己作主;测试免费,并且测试时间没有限制。
灾备中心建设成本高;运营维护成本高;建设周期较长;资源利用率低,且随着单位的发展,恢复资源可能滞后;技术与实施难度大、管理与维护要求高;运营队伍难以保持稳定。
风险控制要求高,资产规模大、技术与资金实力强的单位。
共建
降低投资成本;加强行业联合。
技术与管理难度大;人员组织和管理困难;责任不易界定;合作模式要求高;数据的安全难以保证;灾难恢复系统的可用性难以保障。
适合同行业之间,且竞争不明显的单位。
外包
成本低,可以大幅度降低灾备投资;灾难恢复服务提供商具有专业优势,可得专业化服务;较短时间内实现灾难恢复目标;资源共享带有灵活性;易于扩展。
单位网络必须延伸到恢复站点;服务商的自身实力、服务质量等会影响灾难恢复系统的建设和运行。
 


从国际上看,特别是美国,灾难恢复行业已经比较成熟,鉴于灾难恢复系统是为高风险、小概率事件所准备的,资金投入大、运行维护成本高,灾难恢复技术人员的专业性要求高,灾难备份中心的管理十分规范和严格等特点,外包是灾难恢复建设的主要方式。调查显示,使用外包服务的比例达到了71%,这其中也包括美国国防部的灾难恢复系统、澳大利亚政府的电子政务系统等。


在灾难恢复建设外包过程中,用户还可根据自身实际情况,在灾难恢复系统的投资模式、灾难恢复资源使用模式和灾难恢复系统的运营管理模式方面进行合理选择,常用的模式选择主要有以下几种:


1.灾难恢复系统投资模式


. 灾难恢复系统由外包服务商投资建设和运营管理,用户整体租用;

  . 用户自己投资或双方共同投资,外包服务商负责提供托管服务等。


2.灾难备份中心资源使用模式


. 专属使用模式(Dedicated):专属资源可包括专属数据备份系统、专属备份数据处理系统、专属通信网络系统、专属机房空间、专属工作环境等;

  . 确保使用模式(Guaranteed):在灾难发生时,外包服务商可确保客户得到灾难恢复所需的备份数据处理系统、通信网络系统、机房空间、工作环境等资源;

  . 共享使用模式(Shared):客户灾难演练与灾难恢复所需要的备份数据处理系统、通信网络系统、工作环境等资源由多个客户共享,其使用方式为先到先得。


3.灾难恢复系统运营管理模式


. 外包服务商负责运行管理服务;

  . 客户自行管理模式等。


灾难备份中心的选择和建设


灾难备份中心是用于灾难发生时接替生产系统运行进行数据处理和支持关键业务功能运作的场所,它用来提供稳定的、长期的数据备份与灾难恢复服务,更侧重于如何提高灾难恢复能力。灾难备份中心在选址要求、建设规划和运营管理方面都不同于生产中心。


灾难备份中心的主要选址原则:


1.策略性。明确对灾难备份中心的定位,即灾难备份中心的建设目的是防范什么样的灾难事件,在灾难发生的时候又能够提供何种服务。根据定位的不同,在中心选址时应采取不同的策略。


2.风险性。选择或建设灾难备份中心时,要注意备选的场址所包含的风险是否是在单位所容忍的风险范围之内,或者是符合所制定灾难恢复规划或业务连续计划的要求。例如,考虑生产中心与灾难备份中心之间应保持适当地距离,避免因同一灾难导致两个中心同时处于灾难事件当中。


3.科学性。选择或建设灾难备份中心时,应对备选的场址进行相关的场地风险分析,科学、全面的评价各备选的场址。


4.适合性。对于选定的场址而言,首先要符合GB/T 2887-2000《电子计算机场地通用规范》的要求;其次要关注场址周边环境、地质地理条件、市政配套条件、电力供应条件、通讯服务商所能提供的服务能力等诸多因素,判断是否适合建设灾难备份中心。


5.便捷性。对于灾难备份中心,灾难恢复小组快速抵达的意义非常大,其周边应有多条道路用于保证相关人员和物资能顺利、快速到达。


从建设规划方面,灾难恢复中心和普通数据中心相比,有许多额外的要求,比如:灾难备份中心必须有严格的安全监察措施;对于通信线路、设备和服务商的选择,灾难备份中心应该有更高的级别;应具备应急中心媒体发布室、通信室、会议室、工作坐席,并准备办公设备;对于非恢复用的生活设施,在灾难备份中心中也是有要求的。