Menu

容灾备份系统技术分析及原理研究

0 Comment

随着越来越多的系统采用数据库形式存储基本数据,数据的安全存储问题是业务系统设计问题的一个重组成部分。该文介绍了容灾技术的主分类和工作原理,并对每种容灾备份系统的技术原理进行了探讨。
关键词容灾;数据复制;日志;逻辑磁盘卷
中图分类号TP311 文献标识码A 文章编号19-344(212)3-7182-4
容灾系统的建设需有多种数据复制技术,以满足多种应用和业务系统的需求1。无论采用何种技术方式,最核心、最重还是对数据的保护。随着数据复制技术的发展,可以实现数据的远程复制,当生产中心发生灾难是,灾备中心在异地(址)利用远程复制数据技术供服务,保障核心业务系统的连续性(BCP)。因此数据复制技术是构建容灾平台的核心2。
按照容灾平台所采用数据复制技术及其位于业务系统IT架构层面的不同,可以将容灾技术方案分为以下三类3
1)基于应用平台的容灾方案
通过一些特定的应用程序或中间件产品,向生产中心和容灾中心,传输生产数据,这些数据此时未经处理,然后由主、备中心的服务器同时处理上述数据。在平时只有主数据中心(生产中心)才和业务系统联接,容灾中心只在后台处理数据;但是当主中心发生灾难,由于容灾中心也有数据库,存有一份完整数据和一套完整的系统,只切换一下网络,就可以迅速接管生产中心业务。
2)基于主机平台的容灾方案
利用一些主机厂家(比如IBM)供的相关功能软件或第三方软件供远程的数据复制技术,实现远程数据复制,建立容灾平台。
3)基于智能存储平台容灾方案
利用智能存储系统的远程数据复制功能实现的容灾平台,它主包括二类
①基于在同类智能存储平台(例如 EMC SRDF 技术)之间的数据复制;
②基于在异构智能存储平台之间利用虚拟存储技术实现数据复制。
本文针对以上“基于智能存储平台的容灾方案”、“基于应用平台的容灾方案(Oracle Data Guard)” 、“基于主机平台的容灾方案”等三类主容灾技术方案进行分析4。
1 基于智能存储系统的远程数据复制技术
所谓智能存储系统技术,简单的说,就是利用磁盘阵列上的智能磁盘控制器,接管原先由主机承担磁盘镜像功能。基于数据复制方式独立于主机和主机操作系统,占用主机CPU资源比较小,整个数据复制工作由阵列本身的智能磁盘控制器完成,只需占用很少的主机通道,对主机系统、对应用透明。但这种方案也有它的不足,该方案网络条件求高,求主、备中心不能间隔太远(通常求在几十公里范围内)。该方法一般都应用于同城灾备。图1则是远程智能存储技术示例图。
2 基于存储虚拟化的远程数据复制
从存储网络方面来看,虚拟化引擎,能使异构的物理的阵列有机组合成更大的存储系统,或者根据需求划分为很多小型存储单元,针对主机容量以及性能标准进行合理配置。目前有两种形式对虚拟化引擎加以控制,一种把带内虚拟化引擎设置在主机与存储系统之间的数据通道,无论是信息控制还是用户数据传输都会经过这一通道,当逻辑卷配置到主机上则表示拥有相对标准化的存储子系统。另外一种为带外虚拟化,虚拟化引擎则不会设置在主机与存储系统之间的数据通道,采取其他网络连接方式和主机系统之间进行通讯。该方法具有如下优势优势
① 能够实现卷管理中央集中控制。
② 将计划或者是非计划系统,备份,维护等所需的停机时间缩短。
③ 高了资源利用率。
④ 独立、高性价比的高级复制服务。
3 基于数据库的数据备份技术
所谓远程数据库复制技术,就是借助数据库系统自带的软件,或者专门的第三发软件,捕获数据库日志(Archive log 或Logical log),将这些数据通过网络传送到容灾中心。在容灾中心的数据库系统上重新执行上述日志文件(容灾中心的数据库一直处于恢复状态)。因此这种技术与应用系统没有直接关系,因而无须对应用程序作大量修改,就可以实现数据的远程复制。该技术可以实现,实时复制、存储转发复制、定时复制三种数据复制方式。5
如图2所示,采用数据库软件复制技术就某种意义上来说能够实现远程数据库复制。采用这种技术有几个技术点
① 生产中心的数据库全备份,建立灾难备份数据库。
② 数据复制过程中,灾备中心的数据库,一直保持在恢复状态,数据库中数据不对外开放。
③ 需定期对备份数据库做激活测试,保证备份数据库的可用性 。
④ 考虑发生灾难时,如何将应用系统切换到容灾中心的数据库。
该技术优点主为
① 对数据链路的的质量求不高,也支持广域网协议,所以生产中心和容灾中心可以离得很远;
② 保护现有投资,目前的数据库、软件、硬件不需太大变动就可以实施。
该技术缺点主为
① 占用一定的主机资源(CPU,内存,网络等);
② 万一发生灾难,业务无法由灾备中心迅速接管并在极短的时间内恢复;
③ 该技术无法实现非数据库数据的远程复制;
④ 对容灾中心的人员数据库技术求高,否则的话全部由数据库公司的工程师维护费用就比较高。
4 基于装置的数据复制技术
存储网络级数据容灾过程中通常采用专门设备仪器为在短时间内有效实现远程复制而供I/O 路径,并在用户端以及灾备中心系统合理配置专门服务器,与此同时还安装相关软件设备。实质上灾备中心专用服务器就某种意义上来说能够实现定时复制服务器数据信息,并对关键性数据信息的远程复制加以维护。至于传输链路选择上则倾向于IP 网络以及FC 网络,假使我们发现IP 城域网或者是广域网带宽较低,则能够进行异步复制。此项装置所供远程复制功能以复制策略服务为基础,严格遵循之前所制定策略同步复制源端数据并将其存储到相关设备,便于下次可直接复制快照差量从而促使数据复制效率能够大幅度升。1借助IP 网络可以将主中心装置服务器对应的磁盘上数据信息直接传输至灾备中心磁盘,避免发生难以预估灾难。和快照代理功能进行有效综合能够在短时间内实现数据信息复制,保证所复制内容的完整性。灾难发生过后数据库不需再次修复或者是全面检查即可实现数据恢复。
5 远程集群主机切换技术
实质上远程集群主机切换技术不属于数据复制技术范畴,但却能够和以上数据复制技术进行有效综合,并对主机系统诸多节点加以控制。一旦发现主节点系统出现故障难以正常运转时控制系统则发挥其最大功效,实现主机之间切换,就管理控制系统而言,需加大控制与监督力度,尤其是主机系统运行状态
硬件系统、操作系统状态;
① 数据库系统的状态;
② 应用软件的状态(API 或者是脚本自行编写与制定应用代理);
③ 网络通信状态(例如局域网、广域网等);
④ 远程数据复制运行状态;
⑤ 通过开发/定制代理严格检测其他相关状态。
通常在考虑远程集群主机切换方案时,首工作就是结合实际情况采取适宜措施有效解决数据远程复制方面问题,反之假使仅限于主机系统之间应用切换,也就没有存在意义。远程集群主机切换方案明确表示节点之间需满足有关通信条件,除此之外各个节点主机必须合理配置集群管理控制软件,管理代理。
6 基于应用软件的数据备份
所谓基于应用软件数据备份中间件产品或者应用程序同步向主生产中心和灾备中心传输生产数据,在2个中心同时处理上述数据,通过监测,一旦发现生产中心发生灾难,应用失效则容灾备份中心应用软件系统能够自行恢复并正常运行,并接管生产中心所有业务。如果保证此种方式得以有效应用,前就是保证2个中心所有应用软件升级一致,原有的应用软件重新开发,以适合容灾需,这样做就会增加软件复杂性,技术水平求高,并且不易于操作,更主的是,不利于后期维护与修复。某种意义上也会严重影响到业务系统性能。6
7 基于主机逻辑磁盘卷的远程数据复制
逻辑磁盘卷(Volume),如图3所示就是在操作系统与物理存储设备之间建立一个逻辑存储管理层。
所谓基于逻辑磁盘卷远程数据复制技术,采用有关软件按照标准对一个(多个)磁盘卷进行异步复制与同步复制。数据卷采用卷管理器供的磁盘镜像功能实现容灾。
在生产中心正常工作模式下,数据的写入操作可以用图4说明数据流向
如果当主数据(生产)中心存储系统发生故障时,生产主机利用异地(址)的数据拷贝继续运行, 图5说明。
当系统的主数据中心存储修复后,恢复数据镜像关系,数据重新在两份拷贝间同步。
如果当系统主数据中心的主机发生故障时,异地(容灾中心)主机接管本地的主机存储及应用,数据同步如常进行图6说明。
当本地主机维修恢复运行后,存储及应用由本地生产主机接管,恢复正常运行环境。因为该技术具有与主机系统、物理存储系统无关的特性,所以对硬件设备的选择也很灵活。但是逻辑磁盘卷远程数据复制技术也有缺点,就是使各个节点主机性能,需求增加。系统业务数据量大,特别在突发访问时系统压力增大了许多,主机负载量随之加大,如果采用这种方式,很不利于系统生产中心的运行。
本文重点介绍了目前主流容灾技术,及他们的特点,实际工作中需充分比较各主流数据备份技术(基于数据库复制、基于逻辑磁盘卷的远程数据复制、基于智能存储的远程数据复制、远程集群主机切换等)优劣利弊和国内的成功案例,并结合业务系统的实际情况,数据备份系统关键是实现核心业务应用系统的数据级容灾备份,确保核心生产数据的安全。
参考文献
1 郝海涛,李勇.灾备方案中的常用数据复制技术J.中国金融电脑,23(5).
2 灾备,谁来建,怎么建?J.中国计算机用户,25(18).
3 叶晓东.如何选择灾备解决方案J.中国金融电脑,26(9).
4 何玉刃,张俊超.数据库技术·应用及实验指导M.北京机械工业出版社,25.
5 黄其民.基于Oracle日志技术的实时灾备方案J.中国科技信息,26(2).
6 范东.用合适的灾备武器保护自己J.中国计算机用户,23(18).