搜档网
当前位置:搜档网 › XXXXVVR容灾方案

XXXXVVR容灾方案

XXXXVVR容灾方案
XXXXVVR容灾方案

1

XXXX 系统 赛门铁克方案 建议书

2010-11

赛门铁克软件(生产中心)有限公司

Your Infrastructure. Your Information. Your Interactions. Only Symantec Protects Them All.

目录

1系统需求分析 (2)

1.1系统建设目标 (2)

1.2需求简析 (2)

2高可用容灾方案设计 (3)

2.1 设计原则 (3)

2.2方案概述 (4)

2.2.1 网络拓扑图 (4)

2.2.2 软件安装 (5)

3高可用容灾方案实现 (5)

3.1 软件功能解释 (6)

3.2 安装、配置过程 (11)

3.3 工作过程 (12)

3.4方案分析 (16)

3.1.1 3.4.1 有关数据的量化分析及结果 (16)

3.1.2方案小结 (17)

1系统需求分析

1.1系统建设目标

建设本系统的目的是为XXXXXXXX系统建立一个全面的、整体的容灾方案,最大限度地保证业务系统工作的连续性、可靠性。

1.2需求简析

在XXXX以往的业务系统中没有考虑本地高可用性, 也没有远程容灾中心.

但是,随着XXXX业务系统的发展,随着竞争的不断加剧,在一些重要的系统中,客户已经不满足于简单的本地保护。越来越多的客户提出了要求更高的系统可用性,要求实现真正的异地容灾保护。因为一旦出现异常情况,如火灾、爆炸、地震、水灾、雷击或某个方向线路故障等自然原因以及电源机器故障、人为破坏等非自然原因引起的灾难,导致业务正常无法进行和重要数据的丢失、破坏,造成的损失将不可估量。因此,XXXX要求业务系统可以在发生上述灾难时快速恢复,将损失降到最低点。

全面的异地容灾保护方案,意味着除了要实现本地的切换保护外,更要实现数据的实时异地复制和业务系统(包括数据库和应用软件)的实时远程切换。

2高可用容灾方案设计

2.1 设计原则

我们为XXXX提供的高可用容灾方案的设计原则如下:

●方案当前即可实施

●在满足要求的前提下尽量简单

●除特别必要,不需要增加另外超出本方案的软硬件

●如果一个软件产品可以实现需要的功能,我们不会再使用另外

的产品实现重复的功能

●同一方案适合多种平台环境,降低安装、管理和维护的难度。

VERITAS的容灾方案是一个完整的方案,该方案包括三个功能:主节点(存储虚拟化)到灾备节点的数据远程实时复制、本地应用服务和数据复制服务的切换保护、应用远程容灾切换。涉及的产品包括V olume Manager+V olume Replicator,VERITAS Cluster Server和Global Cluster Manager。

在该整体方案中中,上层依赖于它的下层,每一层的产品实现相应的功能。

图中涉及的软件产品将在下面论述。

2.2 方案概述

2.2.1 网络拓扑图

本方案在异地搭建容灾中心,通过VVR 技术把生产中心(虚拟存储池)的数据同步到灾备中心,当,出现故障时用GCO 来做自动切换,因为VVR 属于卷复制技术,所以不用考虑存储上是数据库还是文件.,因为灾备中心需要能够接管生产中心和容灾中心的所有业务,所以,要考虑灾备中心的服务器性能问题,可以考虑在灾备中心放两台服务器做备机用来切换.具体数据同步过程和切换过程下面有详细介绍.

在两种情况下,每个地点的每台服务器上安装的软件相同,只是不同情况下配置方法不同,每台服务器的具体配置方法后面讨论。每台服务器安装软件如下:

1) 安装VERITAS V olume Manager(VxVM)

2) 安装VERITAS File System(VxFS)

3) 安装VERITAS V olume Replicator(VVR)

4) 安装VERITAS Cluster Server(VCS)、相应的数据库代理(Agent)和应用软件代

5) 安装VERITAS Global Cluster Manager(GCM)

3高可用容灾方案实现

本章将就该方案的每个细节进行讨论。包括方案的详细讲解,软件的实际配置方法等。通过阅读和理解本章,您将了解VERITAS解决方案的实现方法,并清楚地知道VERITAS解决方案是切实可行的,并且有相关的实施案例和实施经验。

本方案仅需要增加不同地点间的广域连接,需要增加一台主机和一台存储设备。软件方面要用VERITAS高可用软件新增V olume Manager、VERITAS File System、VERITAS V olume Replicator和Global Cluster Manager。

在介绍功能前,需要强调的的是:VERITAS提供的是完整的容灾解决方案。各个软件的功能完全集成在一起,建立一个容远程数据复制、本地容灾、远程应用切换于一体的方案。

在这里,每个软件只解释与本方案相关的那部分功能,

一、VERITAS V olume Manager(简称VxVM) 将在物理磁盘上建立多个或一个逻辑卷(V olume)。以裸设备的方式使用卷,或在卷上建立文件系统。将数据(特别是需要进行远程复制的相关文件系统、数据库)存放在卷上。由于数据复制是基于卷的,所以,V olume 是进行复制的基础。

二、VERITAS V olume Replicator(简称VVR)负责远程数据复制。VVR复制基于V olume进行。复制的数据可以是数据库中的数据(文件方式或裸设备方式)和文件。复制的示意图见图四。

图四

1)VVR与VxVM完全集成在一起。用VxVM管理界面和命令统

一配置管理;由于VVR仅仅将V olume上每次I/O的实际数据实时复制到远程节点,所以在网络线路上传输的数据量很少,对带宽的需求也很小。;

2)将各个业务系统中需要进行远程复制的多个或一个卷定义为一

个Replicated V olume Group(简称RVG);

3)在Site A定义一条RLINK,指向Site B;在Site B也定义一条

指向Site A的RLINK。RLINK是单向的;需要进行复制的两个系统各

定义一个指向对方的RLINK;每个RVG定义一个RLINK。

例如有Site A和Site B两套系统同时用Site C的系统作为备份。在Site A定义一个RVGa,包含需要进行数据复制的卷;在Site B定义一个RVGb,包含需要进行数据复制的卷;在Site C定义两个RVG,名为RVGa’和RVGb’,分别作为Site A RVGa和Site B RVGb的备份。然后,在Site A定义RLINK to_c1,指向Site C;在Site B定义RLINK to_c2,指向Site C;在Site C定义两个RLINK,一个to_a,指向Site A,另一个to_b,指向Site B。

4)Storage Replicator Log(简称SRL)是VVR中的重要部件。将数据复制各方的某个卷定义为一个SRL。需要复制的数据首先要写入SRL,然后传到异地。VVR通过SRL保证数据复制严格按照写顺序进行,这在异步工作方式下非常重要。当网络中断或异地系统出现故障时,本地数据将记录在SRL中,等系统恢复正常时再将SRL中的数据按照先进先出的顺序传送到异地。当SRL满后,VVR将通过Data Chang Map(简称DCM)记录变化过的数据块的块号。

VVR数据流程见图五:

图五

5)Data Change Map(简称DCM)与主节点的RVG相关,它其中的内容是位图信息,记录某一时间点后修改过的数据块位置。DCM在正常情况下不使用,在SRL满后记录变化的数据块的块号,当恢复正常复制后,等SRL中的数据传送完后,将DCM中记录的块传送到异地。灾难恢复后的反向复制也用到DCM。

6)数据复制的工作模式缺省为同步/异步自适应,即在网络延时情况较好、数据能够及时复制时,工作在同步方式,完全保证两边数据的一致性;当网络延时情况较差、数据不能及时复制时,工作在异步方式下,保证主节点的I/O性能。数据复制根据实际情况,自行在两种工作模式之间切换。

如果数据复制的线路带宽有限,出于保证本地服务器读写性能的考虑,可以将复制工作模式定义为异步。由于VVR的数据复制严格按照I/O的修改顺

序进行,所以,无论在同步还是异步工作方式下,都能保证数据的完整

性。对于数据库系统,该复制机制能够保证灾备节点的数据库在灾难发

生时正常启动并提供服务。

7)后备节点的完全同步,即所谓的”建立基线”。在主节点往后备节点正常复制数据前,必须逐块逐块地将主节点中需要复制的数据拷贝到后备节点,也就是说,将双方的RVG进行同步。

后备节点的完全同步分为两种情况,一是复制时主节点应用不进行数据更改,二是复制时主节点应用进行数据更改。两种情况下,都可以采用自动同步方式或采用备份和检查点(Check Point)结合的方法。

自动同步是指通过网络将数据从主节点(Primary)复制到备份节点(Secondary)。方法很简单,只要进行一步操作即可完成。自动同步对带宽要求较高,否则,将无法完成完全同步。自动同步要求RVG中的每个卷都有DCM。

对于网络带宽较小,或者需要完全同步的数据量太大时,使用备份与检查点结合的方法。在备份开始前,在主节点设置检查点,该检查点记录在SRL中,然后将数据备份到活动硬盘、光盘、磁带或其它介质上。备份完成后,将检查点取消。将备份的数据恢复到后备节点上。然后将RLINK连接挂上,主节点SRL中记录的的数据传送到后备节点,完成后,两边数据一致,进入正常数据复制状态。用该方法进行数据完全同步,要求SRL卷大些,等完成后,再将SRL卷通过V olume Manager在线缩小。

8)当某些严重意外情况发生后,后备节点会变成新的主节点,称为角色转换。在灾难期间,不进行数据复制,新的主节点用DCM记录变化数据位置。

9)当原来的主节点在灾难后恢复正常,需要进行数据反向同步和角色转换。

反向同步有两种情况,一种是在灾难发生时刻,原主节点与灾备节点的

数据是同步的(即无未复制的数据);第二种是在灾难发生时刻,原主节点与灾备节点的数据不是完全同步的(即主节点有数据尚未复制到灾备节点)。第二种情况在反向同步开始时第一步首先要进行重置,指将原主节点SRL和DCM中数据(这些数据在灾难发生时尚未来得及传送)的位置信息修改当前主节点(即原后备节点)的DCM。然后,将DCM中指向的数据全部传送到原主节点。而第一种情况的话,直接进行第二步工作。传送完成后,将当前主节点的数据库和应用停止,将双方角色复原,并在原主节点提供正常服务。

10)脱机处理。通过使用VVR的In-Band Control(IBC)消息、Snapshot、以及V olume Manager(VxVM)的FastResync(简称FR,即快速同步)功能,可以实现数据的脱机处理。

脱机处理主要指对后备节点种的数据进行处理,例如进行备份、打印报表、数据仓库处理等。脱机处理由打破后备节点的镜像卷、对镜像数据进行处理、重镜像等几个过程组成。

11)双收条(双重确认)机制。指后备节点对复制数据的接收确认有两个阶段。第一个确认当后备节点收到数据后发出;第二个确认当后备节点数据成功写入硬盘后发出。当主节点收到第二个确认后,将SRL中的相应数据清空。

三、VERITAS Cluster Server(简称VCS)是用于本地容灾的集群软

件,支持多达32个节点的应用级切换,保证本地业务系统的软硬件高可用性。VCS以其出色的可靠性和易管理性闻名。VCS的功能特点请见附录。在本方案中,VCS主要负责以下功能:

1)VCS负责监控和管理硬件系统和操作系统,当出现故障时进行切换。

2)通过数据库代理(Agent)监控和管理数据库系统,当出现故障时进行切换。

3)通过API或脚本编写针对性客户化应用代理,监控和管理应用系统,当出现故障时进行切换。

4)通过Replicator 代理监控和管理数据复制过程,当主服务器数据复制发生故障时,自动将数据复制工作切换到后备服务器,保证数据

复制过程的连续性。这点对于容灾系统非常重要。该代理充分说明

VERITAS提供的是完整的容灾解决方案。

5)主节点和备份节点的VCS集群系统都在Global Cluster Manager 的统一监控和管理下,从而实现集群系统间的远程应用切换。GCM在

VCS中以两个服务组(指GCM Master和GCM Slave)的形式存在。

四、Global Cluster Server(简称GCM)可以称为Cluster’s Cluster(集群的集

群)。它负责对多个不同地点的多达32个集群系统进行监控和管理,在发生严重灾难时,进行site的切换(即应用的远程切换)。

GCM Console为Web界面,通过浏览器管理各个Cluster系统,并在管理界面中主动控制或响应远程切换。

3.2 安装、配置过程

在硬件和操作系统环境准备好后,整个方案的实际安装、配置及工作过程如下。详细的配置命令和配置文件见附录。

一、安装VERITAS V olume Manager(VxVM)和File System(VxFS)。将服务器本地

硬盘的其中一个分区(或整个硬盘)作为rootdg。将磁盘阵列中所有磁盘用V olume Manager管理。创建一个disk group,包括涉及的磁盘,并在这些磁盘上划分出需要的卷,包括用于SRL的卷。如果卷上需要文件系统,使用VxFS。将数据库和应用系统都安装在共享的磁盘阵列卷中。

二、由于VVR与VxVM集成在一起,所以无需另外安装。

1)为需要复制的卷增加DCM。

2)创建SRL。

3)定义RLINK,指向备份节点。

4)定义RVG,将需要进行远程复制的卷(包括SRL卷)都定义到一个RVG中,

并与RLINK联合绑定。

5)进行数据复制。

三、安装VCS、Oracle或Sybase代理、客户化应用代理和VVR代理。安装完成

后,配置心跳线,然后对各个服务组(Service Group)中涉及的资源进行定义。进行本地切换测试,优化有关参数。

四、安装GCM。安装完成后,在VCS的服务组(Service Group)中增加了GCM

Master 和GCM Slave。对其进行配置。定义GCM响应的事件和相应的处理动作。用手工模式进行异地容灾切换测试,并调优化有关参数。

五、进行全系统联调,测试各种情况下的系统工作情况,并进一步优化有关参

数。

3.3 工作过程

为方便论述,本节模拟地点A和B,两地各有一套建立在VCS双节点集群上的业务系统,以B地点的系统作为A地点的备份。

切换示意图见图六。

一、正常情况下:

1)业务系统运行在地点A,包括数据库实例、有关的文件、数据库数据、应用软件。A节点对外提供服务。

2)A节点所有的有关的数据通过VVR实时复制到B节点。

3)两地的VCS对的各自节点内的两台服务器的主机情况、数据库服务、应用软件进行实时监控和管理,其中,VCS还对VVR数据复制服务进行监

控。

4)GCM 监控两地Cluster系统的运行。

二、当A地点的主服务器发生硬件或软件故障,导致主服务器无法提供正常服

务:

1)VCS进行本地切换,将主服务器的数据库服务、应用软件、VVR数据复制服务切换到本地后备节点。

2)整个系统运行在本地后备节点,包括VVR数据复制服务,由后备服务器提供对外服务和数据复制服务。

3)GCM将监控到该切换事件的发生。

4)如果仅仅是主服务器数据复制服务发生故障,可以不进行切换,只需将复制服务修复并正常运行。

三、如果A地点的主服务器恢复正常,整个系统将重新运行在正常情况下。

四、如果在情况二的状态下,A地点的后备服务器也发生硬件或软件故障,整个A

地点无法正常提供服务:

1)GCM 将监控到该严重灾难的发生,将对接收到的Site A down事件进行处理:发出严重告警,并在管理界面上弹出服务灾难性切换(及服务切换到

远程地点)等待确认画面。

2)在有关人员确认后,在GCM切换等待确认画面上按确认按钮,将进行地点间的容灾切换。

3)A地点的业务将在B地点正常提供服务。

4)数据复制暂停。

5)Site B的VVR将从Secondary变成New Primary,使用DCM记录所有变化的数据块。

五、如果A、B地点间网络发生故障:

1)VVR心跳检测将发现该故障,A地点VVR将根据事先的配置进行处理。

我们的建议是VVR将网络故障期间所有数据的更改记录在SRL。

2)如果在一段较长时间内,网络故障无法恢复。当VVR的SRL卷接近满时,VVR将使用DCM,记录变化的数据块位图。

3)在网络故障发生后,GCM将探测到,并对Network Down 事件进行处理:向有关管理员发出告警。

六、如果A、B地点间网络在短时间内恢复正常。

1)VVR将把A的SRL中积累的数据传送到B。

2)VVR处于正常工作状态。

3)GCM处于正常工作状态。

七、如果A、B地点间网络在很长时间内仍无法恢复正常:

1)VVR停止远程数据复制。

2)GCM无法对两地间的Cluster运行进行监控。

八、灾难复原。当A地点的系统恢复正常后,需要进行整个系统的回迁。数据反向

复制时只复制灾难期间变化的数据而不是所有的数据,这是本方案优势之一。

1)在灾难期间,B地点是VVR的New Primary,B的DCM记录所有变化的数据块。

2)A系统正常后,VVR重新建立与B节点的RLINK连接,并自动变成Pseudo Secondary(伪后备节点)。

3)GCM 发现A、B地点Cluster恢复正常,对它们进行正常管理。以下过程将在脚本中自动完成。

4)进行反向同步的第一步是将A节点的Pseudo Secondary状态转成Secondary状态。

5)第二步将进行A的SRL和DCM的重置(Replay),修改B的DCM。

因为在A节点发生灾难时,有可能A的SRL中有没来得及进行传送得数据,甚至DCM中标记的数据块没来得及进行传送。也就是说,A中有一些本地已经修改,而B还未修改的数据。所以,要保持A、B数据的一致性,一定要首先对这些数据进行处理。

处理方法成为重置(Replay)。重置将把A节点SRL中数据或DCM中标记的数据位图信息传送到B节点。B节点将进行判断,根据数据块是否有新的修改,对DCM进行置位。

6)重置完成后,将进行数据的反向同步,将灾难期间B节点变化的数据(和需要A节点重置的数据)传送到A。

7)以上的过程中,B的数据库和应用都处于正常运行状态。

8)当反向同步完成后,数据库和应用将停止运行。

9) GCM控制进行整个系统的反向切换。

10)A节点重新成为VVR的Primary,进行正常复制。

11)A节点整个业务系统恢复正常运行。

3.4方案分析

本章将就XXXX需求书中提出的要求分析方案。通过分析,说明方案符合需求,并进一步讲解方案的细节。

3.1.13.

4.1 有关数据的量化分析及结果

涉及数据库的系统业务,除了对数据库内容的更改进行实时数据复制外,还要复制有关的系统文件,例如环境配置信息、数据库环境配置信息。在带宽允许的情况下,我们将对整个数据库有关的内容,包括数据库安装软件、数据库数据等等都实时复制到灾备节点。当发生灾难时,恢复的时间会很短。

对于VVR对数据库内容的复制,就oracle 为例,有两种方法:

1)仅复制Archive Log和Online Redo Log。该方法的优点是复制数据量小,对带宽要求小,而且比数据库本身的复制功能更能保持数据一致性,因为

数据库本身的复制仅复制Archive Log。缺点是后备节点要进行Log中的

交易重提交,当发生灾难后,后备节点可能需要较长时间才能提供正常服

务。

2)数据库的内容和Log都进行复制。该方法的优点是更好地保持数据的一致性,而且发生灾难时,后备系统恢复正常服务的时间较短。缺点是复

制的数据量较大,对带宽的要求较高。

根据计算,由于带宽允许,所以,将进行数据库内容和Log的复制。

以下是根据《XXXX需求书》中的业务数据进行计算后得到的所需带宽和SRL 的尺寸。需要根据实际情况计算.,下面是公式

一、带宽计算:

1. 平均带宽需求

每秒操作涉及到的更新的数据:XXXXx Bytes

冗余系数: 1.5

(指数据库表操作引起的索引文件,控制文件,LOG文件等的修改)

加冗余后每秒操作涉及到的更新的数据:XXXXx * 1.5=yyyy Bytes

加冗余后每小时操作涉及到的更新的数据:yyyy * 3600=zzzz Bytes 加冗余后每天操作涉及到的更新的数据:zzzz * 24 = pppp Bytes

平均带宽需求:yyyy*8/1000=qqqq Kbit/s

2. VVR带宽需求

VVR控制信息:约占总带宽的3-5%

IP打包数据占每次I/O的百分比约5-10%

总带宽需求: qqqq*1.15=aaaa bit/s

二、SRL容量计算

SRL(即数据复制的日志区)的容量计算,将视实际情况(如磁盘实际容量、网络平均故障修复时间、变化数据量等)定。例如一般情况下,网络故障在8小时内修复,则将SRL的容量定为8小时内数据变化量再加上一定的冗余。

三、结论

如果带宽充裕,可以使用同步/异步自适应的工作方式;如果带宽不是很充裕(例如1-4Mbits/s),为了保证业务系统的性能,建议VVR工作在异步方式下。

3.1.23.

4.2 方案小结

本方案的特点:是一个完整的容本地容灾、数据远程复制和远程容灾切换于一体的方案。本方案完全符合《XXXXXXXX系统需求书》的技术指标,完全实现

XXXXXXXX系统业务的全面容灾需求。

以下说明本方案的优势。

一、本方案能够支持手动/自动信令容灾方案,用户可以根据实际需要进行自由

选择。但在实际情况中,由于发生重大灾难时业务异地切换属于非常严重的事故,所以我们建议该过程前用户进行电话确认,然后在GCM界面中按下切换确认按钮进行切换。

二、当本地主系统恢复正常后,需要进行反向数据同步、应用切换等工作,该工

作需要由操作人员在系统较空闲时进行。工作过程很简单。

三、通过SRL、DCM、严格的按写顺序传送、双收条确认、反向切换时的重置

等技术的使用,本方案可以最大限度地保证主、备节点的数据一致性。

四、本方案支持 1+1、N+1和节点互备方式,满足用户的不同需求。

五、本方案如果不考虑带宽,节点间没有距离的限制。由于VVR的数据传递是

基于卷,所以每次传送的数据量基本就是每次系统I/O的数据大小。这样可以得到最大的带宽利用率。

六、基线建立,需要主备节点的数据完全同步。完全同步在应用运行期间也可以

完成。可以采用自动同步方式或使用备份和检查点(Check Point)结合的方法。

七、至于基线建立过程、日常复制过程、故障切换过程和故障恢复过程对主机性

能的影响,由于对不同的配置、不同的情况将有很大的区别,所以,很难给出具体的数值。以我们在以往实施中的经验,如果采用异步复制方式,对整个系统的影响,在5%左右。

系统容灾解决方案

系统容灾解决方案 容灾基本概念 容灾是一个范畴比较广泛的概念,广义上,我们可以把所有与业务连续性相关的内容都纳入容灾。容灾是一个系统工程,它包括支持用户业务的方方面面。而容灾对于IT而言,就是提供一个能防止用户业务系统遭受各种灾难影响及破坏的计算机系统。容灾还表现为一种未雨绸缪的主动性,而不是在灾难发生后的“亡羊补牢”。 从狭义的角度,我们平常所谈论的容灾是指:除了生产站点以外,用户另外建立的冗余站点,当灾难发生,生产站点受到破坏时,冗余站点可以接管用户正常的业务,达到业务不间断的目的。为了达到更高的可用性,许多用户甚至建立多个冗余站点。 容灾系统是指在相隔较远的异地,建立两套或多套功能相同的IT系统,互相之间可以进行健康状态监视和功能切换,当一处系统因意外(如火灾、地震等)停止工作时,整个应用系统可以切换到另一处,使得该系统功能可以继续正常工作。容灾技术是系统的高可用性技术的一个组成部分,容灾系统更加强调处理外界环境对系统的影响,特别是灾难性事件对整个IT节点的影响,提供节点级别的系统恢复功能。 要实现容灾,首先要了解哪些事件可以定义为灾难?典型的灾难事件是自然灾难,如火灾、洪水、地震、飓风、龙卷风、台风等;还有其它如原提供给业务运营所需的服务中断,出现设备故障、软件错误、网络中断和电力故障等等;此外,人为的因素往往也会酿成大祸,如操作员错误、破坏、植入有害代码和病毒袭击等。现阶段,由于信息技术正处在高速发展的阶段,很多生产流程和制度仍不完善,加之缺乏经验,这方面的损失屡见不鲜。 容灾的七个层次 等级1: 被定义为没有信息存储的需求,没有建立备援硬件平台的需求,也没有发展应急计划的需求,数据仅在本地进行备份恢复,没有数据送往异地。这种方式是成本最低的灾难恢复解决方案,但事实上这种恢复并没有真正达到灾难恢复的能力。 一种典型等级1方式就是采用本地磁带库自动备份方案,通过制定相关的备份策略,可以实现系统等级1备份。 等级2: 是一种为许多站点采用的备份标准方式。数据在完成写操作之后,将会送到远离本地的地方,同时具备有数据恢复的程序。在灾难发生后,在一台未启动的计算机上重新完成。系统和数据将被恢复并重新与网络相连。这种灾难恢复方案相对来说成本较低,但同时有难以管理的问题,即很难知道什么样的数据在什么样的地方。这种情况下,恢复时间长短依赖于何时硬件平台能够被提供和准备好。

数据中心容灾备份方案完整版

数据中心容灾备份方案 HEN system office room 【HEN16H-HENS2AHENS8Q8-HENH1688】

数据保护系统 医院备份、容灾及归档数据容灾 解决方案 1、前言 在医院信息化建设中,HIS、PACS、RIS、LIS 等临床信息系统得到广泛应用。医院信息化 HIS、LIS 和 PACS 等系统是目前各个医院的核心业务系统,承担了病人诊疗信息、行政管理信息、检验信息的录入、查询及监控等工作,任何的系统停机或数据丢失轻则降低患者的满意度、医院的信誉丢失,重则引起医患纠纷、法律问题或社会问题。为了保证各业务系统的高可用性,必须针对核心系统建立数据安全保护,做到“不停、不丢、可追查”,以确保核心业务系统得到全面保护。 随着电子病历新规在 4 月 1 日的正式施行,《电子病历应用管理规范(试行)》要求电子病历的书写、存储、使用和封存等均需按相关规定进行,根据规范,门(急)诊电子病历由医疗机构保管的,保存时间自患者最后一次就诊之日起不少于15 年;住院电子病历保存时间自患者最后一次出院之日起不少于 30 年。

2、医院备份、容灾及归档解决方案 针对医疗卫生行业的特点和医院信息化建设中的主要应用,包括:HIS、PACS、RIS、LIS 等,本公司推出基于数据保护系统的多种解决方案,以达到对医院信息化系统提供全面的保护以及核心应用系统的异地备份容灾 数据备份解决方案 针对于医院的 HIS、PACS、LIS 等服务器进行数据备份时,数据保护系统的备份架构采用三层构架。 备份软件主控层(内置一体机):负责管理制定全域内的备份策略和跟踪客户端的备份,能够管理磁盘空间和磁带库库及光盘库,实现多个客户端的数据备份。备份软件主服务器是备份域内集中管理的核心。 客户端层(数据库和操作系统客户端):其他应用服务器和数据库服务器安装备份软件标准客户端,通过这个客户端完成每台服务器的 LAN 或 LAN-FREE 备份工作。另外,为包含数据库的客户端安装数据库代理程序,从而保证数据库的在线热备份。 备份介质层(内置虚拟带库):主流备份介质有备份存储或虚拟带库等磁盘介质、物理磁带库等,一般建议将备份存储或虚拟带库等磁盘介质作为一级备份介质,用于近期的备份数据存放,将物理磁带库或者光盘库作为二级备份介质,用于长期的备份数据存放。

容灾项目方案设计

容灾项目方案设计

目录

容灾技术规范 作为风险防范系统,灾备系统建设本身在总体规划、方案选择和投产实施后的管理运行,以及真正面对灾难时的切换操作等方面也存在着潜在的风险。 计算机信息系统实现数据大集、应用大集中后,系统的运行安全成为风险控制的焦点。目前,已经有多系统开始或准备进行灾备系统的建设,灾备系统建设的目标是减灾容灾,使计算机信息系统和数据能够最大限度地防范和化解各种意外和灾害所带来的风险。然而,与大多数工程一样,灾备系统建设本身在总体规划、方案选择和投产实施后的管理运行,以及真正面对灾难时的切换操作等方面也存在着潜在的风险。 可以说,风险防范系统本身也存在风险点,需要小心应对。 灾备系统建设中所涉及的潜在风险大致可分为技术风险、管理风险和投资风险,其中尤以技术选择风险最大,技术方案选择优越,可以规避一定的管理风险和投资风险。而这三者也存在内在的相互关联,不同灾备级别对应的建设投资规模、所采用的技术以及实施和管理的复杂度也不同,应考虑保护计算机系统的原有投资并提高灾备系统建设投资的利用率。 1.1 容灾的总体规划 1.2 真正的容灾是数据被不间断的一致性访问! 在灾难备份的世界里,是有等级观念的,级别不同,灾备系统所采用的技术和达到的功能是不同的,在系统建设资金投入方面的差距也很巨大。所以,对用户来说,明确灾备系统建设的总体规划十分必要。 1.2.1 技术指标RPO、RTO 衡量容灾技术的两个技术指标RPO、RTO RPO(Recovery Point Objective): 以数据为出发点,主要指的是业务系统所能容忍的数据丢失量。及在发生灾难,容灾系统接替原生产系统运行时,容灾系统与原

数据中心容灾备份方案

数据保护系统 医院备份、容灾及归档数据容灾 解决方案

1、前言 在医院信息化建设中,HIS、PACS、RIS、LIS 等临床信息系统得到广泛应用。医院信息化HIS、LIS 和PACS 等系统是目前各个医院的核心业务系统,承担了 病人诊疗信息、行政管理信息、检验信息的录入、查询及监控等工作,任何的系统停机或数据丢失轻则降低患者的满意度、医院的信誉丢失,重则引起医患纠纷、法律问题或社会问题。为了保证各业务系统的高可用性,必须针对核心系统建立数据安全保护,做到“不停、不丢、可追查”,以确保核心业务系统得到全面保护。 随着电子病历新规在 4 月 1 日的正式施行,《电子病历应用管理规范(试行)》要求电子病历的书写、存储、使用和封存等均需按相关规定进行,根据规范,门(急)诊电子病历由医疗机构保管的,保存时间自患者最后一次就诊之日起不少于15 年;住院电子病历保存时间自患者最后一次出院之日起不少于30 年。

2、医院备份、容灾及归档解决方案 针对医疗卫生行业的特点和医院信息化建设中的主要应用,包括:HIS、PACS、RIS、LIS 等,本公司推出基于数据保护系统的多种解决方案,以达到对医院信息化系统提供全面的保护以及核心应用系统的异地备份容灾 2.1 数据备份解决方案 针对于医院的HIS、PACS、LIS 等服务器进行数据备份时,数据保护系统的备份架构采用三层构架。 备份软件主控层(内置一体机):负责管理制定全域内的备份策略和跟踪客户端的备份,能够管理磁盘空间和磁带库库及光盘库,实现多个客户端的数据备份。备份软件主服务器是备份域内集中管理的核心。 客户端层(数据库和操作系统客户端):其他应用服务器和数据库服务器安装备份软件标准客户端,通过这个客户端完成每台服务器的LAN 或LAN-FREE 备份工作。另外,为包含数据库的客户端安装数据库代理程序,从而保证数据库的在线热备份。

电信核心业务系统容灾解决方案

电信核心业务系统容灾解决方案 Oracle 技术产品咨询顾问高壮志2004/05/24 随着电信运营商多年的系统建设,其核心业务系统的高可用性越来越受到人们的关注。从整个系统的角度来看高可用性,包括主机、操作系统、数据库、应用、网络设备等许多方面。而这些系统的一个显著特点就是以数据为中心,因此对数据的保护是整个系统高可用性的核心体现。Oracle数据库作为电信运营商核心系统的主流数据库,针对企业用户的重要数据、重要业务高可用性的需求提出了建立在数据库级别的容灾方案-- Oracle Data Guard (数据卫士)。 为什么要使用Data Guard 电信行业现有系统在容灾方面基本上有两种做法。一是采用备份的方法,即定期地将数据备份到硬盘和磁带上。这种方法的缺陷是实时性较差,恢复时间较长;另外备份设备和生产系统一般都处于同一物理位置,不能满足异地容灾的要求。另一种做法就是硬件镜像的做法,这种做法在硬件投资上较大,对两点间网络带宽有较大要求。鱼和熊掌,可否兼得?下面让我们来看看Oracle Data Guard解决方案。 Oracle Data Guard Oracle9i Data Guard 维护了一个或多个与客户生产数据的同步备份。Oracle9i Data Guard配置包括一个松散连接的系统集合,由一个生产数据库和若干备用数据库组成,形成一个独立、易于管理的数据保护方案。现有运营商的核心业务系统的数据库在物理位置上往往位于省信息中心或计费中心的机房内,如果在同一城市有其它机房或利用其它城市机房部署同步备份的数据库,通过Oracle网络服务连接到一起,就可以构成一个很好的容灾解决方案。在修改主数据库时,对主数据库更改而生成的更新数据即发送到备用数据库,这些更改在备用数据库被重新应用。当生产数据库出现故障时,备用数据库可以继续提供服务。 图1提供了一个例子。 图1简单的双工作区配置

集中备份容灾系统设计方案解析

数据集中备份容灾系统方案 目前,越来越多的集团企业依赖信息系统支撑其关键业务的开展,越来越多的企业在逐步重视容灾技术,将其作为企业在遭受灾难经历后保证企业尽快恢复业务的重要手段。但实际上,容灾(DT,Disaster Tolerance),或者灾难恢复(DR,Disaster Recovery)是企业保证其业务信息系统实现不间断运行的主要技术手段。企业的最终目的是实现业务连续性(BC,Business Continuity),即当企业面临危机和灾难时,能及时恢复正常,把损失降低到最低限度,保证业务的高可用性。许多企业发现,要尽可能地保证企业业务的连续性,仅仅在技术层面考虑是不够的,还需要制定和管理一系列方法、策略、流程、条件以及部门和人力资源调配方案等等,因此,现在大部分企业在业务连续性的层面上进行统一规划和实施。 具体来说,业务连续性是一种由计划和执行过程组成的策略,其目的是为了保证企业包括生产、销售、市场、财务、管理以及其他各种重要的功能完全在内的运营状况百分之百可用。相比之下,灾难备份只是一种尽可能减少宕机损失的工具或者策略。不过,灾难备份是业务连续性的基础,没有前者,后者就是空中楼阁,但是如果一个灾难备份系统使数据恢复正常的时间过长,那也就不存在所谓的业务连续性了,缩短这个时间,就是业务连续性的目标,消除这个时间,则是业务连续性的终极目标。 所谓灾难,通常指关键业务的信息服务中断,且中断的时间让人不能忍受。引起灾难的因素很多,可以是小系统中的硬件故障,还可以是因火灾、飓风、地震而引起的数据处理设备的损坏,只要造成了关键业务的中断,都是灾难。容灾就是为恢复计算机系统提供的保障,这些保障包括备份中心、备份设备和备份数据等。 从以上对容灾系统特点分析可以看出,目前系统还无法完成现有状况下的备份和容灾要求,其设计已经不能满足企业级用户日益缩减的备份窗口下海量数据的容灾备份需求,随着业务的发展,数据量将会更加庞大,以上问题也将日益突出,因此我们从容灾技术路线的比较来分析如何有效的解决以上问题

容灾备份-解决方案方法

容灾备份系统 2010-8-11 项目背景 随着计算机技术的快速发展,每个企业都在大量的使用计算机处理自己的核心数据,这些数据往往是企业生产经营必不可少的部分。依赖这些数据的计算机系统的停机往往会造成企业生产经营活动的停顿,给企业造成巨大的损失。所以,可以说,这些数据是企业的生命核心。

企业的IT 管理员为了保证生产经营活动的持续运行,不断的加强对系统和数据的保护,如使用基于双机的高可用技术,磁盘阵列系统的RAID 技术等。然而,人们依然无法 回避由于磁盘故障,人为失误,应用程序的逻辑错误,自然灾害等原因带来的系统停机或者 数据丢失。所以,数据备份作为数据保护的最后一道屏障,必不可少。 二、功能介绍 实时保护:连续捕获、实时备份数据变化,全过程保护数据安全。实现真正的持续性 数据保护(CDP),无需设置任何备份时间点,居国内外同类产品领先地位。 完善备份:同一软件可实现“数据库双机热备+接管”、“本地实时灾备” 、“异 地实时灾备” ,全方位保证数据库安全。 任意回退:可按任意操作步数或时间点进行数据回退。主数据库遭到破坏时,备份数 据库可将主数据库回退到损坏前最后时刻的状态,且能保证事件的完整性。 快速恢复:主数据库或表损坏,从站自动检测,提示回退的步数。恢复1个G数据 库在3-5分钟。 增量备份:只备份变化部分,在保障备份数据安全的同时减少备份的工作量。 错峰机制:在系统负荷极大时暂停备份以免系统瘫痪,当系统负荷下降时备份暂停 期间的数据,并重新开始实时备份。 低耗资源:对主数据库压力小,系统采用消息机制,只有灾数据库发生变化时才触 发,只传数据库的变化部分,不同于文件拷贝,和数据表的轮询。 操作简单:自主开发设计,着重考虑国内用户使用习惯,安装、设置非常简单。维护 方便:启动或连接中断后重连时,自动校验主从站数据,保证数据准确。 加密传输:底层通讯采用自主研发的通讯平台,所有数据都是用加密数据包进行数据 交换,充分保证数据安全。 高性价比:在各项性能领先的同时,价格远远优于国外软件。当选择不接管的热 容灾备份方式时,从站可采用低档Server 或高稳定性的PC(有足够的存储空间即 可),从而实现极低的总体成本。 通用性好:不对数据库中的应用做任何修改。与数据库中表的结构无关,且无任 何限制。对数据库备份完整:如TABLES(表)、DIAGRAM(S关系图)、VIEWS(视图)、USERS(用户)、ROLES、RULES等。

某公司系统容灾解决建设方案

某公司软件容灾方案 1容灾软件 Symantec 的存储管理软件VERITAS Storage Foundation(简称SF)适用于企业存储管理的标准化平台,它不仅提供比操作系统本身逻辑卷管理器更加强大的在线卷管理功能,还提供许多高级的存储管理功能,其中包括用于容灾的数据镜像、数据复制等功能。是目前市场上广泛使用的容灾软件。 Symantec VERITAS Cluster Server(简称VCS)是一个用于容灾演练、应用级容灾的软件。它是在基本的HA软件功能的基础上发展而来的。 Veritas Storage Foundation 软件可以根据企业不同需求,提供不同的容灾解决方案,小到同城数据镜像,大到两地三中心数据容灾。SF与VCS紧密集成,可以提供完整的、从数据到应用、并自动实时演练的企业容灾方案。 铁道部高铁指挥实验系统采用了SF/VCS实现了容灾。

2数据同城镜像方式 利用灾备中信和主中心之间或者同机房内的裸光纤线路构成SAN环境,直接采用Storage Foundation在两个存储之间实现存储镜像。即所有数据都将同时写入两边的磁盘整列中。 如上图所示,主中心的服务器将应用的每个写i/o数据同时写入到两个中心的存储中。由于镜像的实现是依托于底层的Volume,所有数据存取的过程对于应用来说都是透明的。我们可以通过设臵Volume Manager的读取策略来指定主中心的服务器从本地的磁盘阵列上读取数据,加快数据查询的速度。 在这个场景中,数据发生物理错误的可能性基本上分为两种,生产中心的存储系统出现物理错误,如硬盘问题、光纤卡问题、光纤连接问题或光纤交换机问题等,另外一种就是整个数据中心出现故障。

容灾整体解决方案

XX 容灾整体解决方案

第1章

前言................................................................................................................................................2

容灾整体解决方案 第2章 2.1 2.2 2.2.1 2.2.2 2.3 2.4 容灾概述........................................................................................................................................3
概述 ...........................................................................................................................................................3 业务连续性管理简介................................................................................................................................5 《规范》简介 .........................................................................................................................................5 恢复时间目标(RTO)与恢复点目标(RPO)...................................................................................8 容灾系统建设的流程..............................................................................................................................10 容灾系统中的人员组织安排..................................................................................................................12 第3章 容灾建设中 IT 技术的选择 ........................................................................................................14
3.1.1
容灾中 IT 技术的选择..........................................................................................................................14 主流厂商解决方案简介 ..............................................................................................................23
第4章 4.1.1 4.1.2 4.1.3
EMC 容灾解决方案简介 .....................................................................................................................23 SYMMENTEC|VERITAS 整体解决方案简介.....................................................................................26 HDS 容灾解决方案简介.......................................................................................................................29 京北方公司容灾解决方案 ..........................................................................................................32
第5章 5.1.1 5.1.2
京北方公司容灾建设分阶段论............................................................................................................32 京北方公司容灾体系各阶段推荐的产品及产品优势 ........................................................................32 附件..............................................................................................................................................35
第6章
1-

数据容灾备份设计方案

数据容灾备份设计方案 1.1数据备份的主要方式 目前比较实用的的数据备份方式可分为本地备份异地保存、远程磁带库与光盘库、远程关键数据+定期备份、远程数据库复制、网络数据镜像、远程镜像磁盘等六种。 (1)本地备份异地保存 是指按一定的时间间隔(如一天)将系统某一时刻的数据备份到磁带、磁盘、光盘等介质上,然后及时地传递到远离运行中心的、安全的地方保存起来。 (2)远程磁带库、光盘库 是指通过网络将数据传送到远离生产中心的磁带库或光盘库系统。本方式要求在生产系统与磁带库或光盘库系统之间建立通信线路。 — (3)远程关键数据+定期备份 本方式定期备份全部数据,同时生产系统实时向备份系统传送数据库日志或应用系统交易流水等关键数据。 (4)远程数据库复制 生产系统相分离的备份系统上建立生产系统上重要数据库的一个镜像拷贝,通过通信线路将生产系统的数据库日志传送到备份系统,使备份系统的数据库与生产系统的数据库数据变化保持同步。 (5)网络数据镜像 是指对生产系统的数据库数据和重要的数据与目标文件进行监控与跟踪,并将对这些数据及目标文件的操作日志通过网络实时传送到备份系统,备份系统则根据操作日志对磁盘中数据进行更新,以保证生产系统与备份系统数据同步。 (6)远程镜像磁盘 利用高速光纤通信线路和特殊的磁盘控制技术将镜像磁盘安放到远 …

离生产系统的地方,镜像磁盘的数据与主磁盘数据以实时同步或实时异步方式保持一致。磁盘镜像可备份所有类型的数据。备份拓扑网络结构1.2(即东风东路院区中心机广州市第八人民医院具有两个不同地点的中心机房房和嘉禾院区中心机房),在这基础上是可以构建一个异地容灾的数据备份系统,以确保本单位的系统正常运营及对关键业务数据进行有效地保护,以下设计方案仅提供参考。嘉禾院区数据中心东风东院区数据中心 本方案中,我们采用EMC的CDP保护技术来实现数据的连续保护和容灾系统。 1.在东风东院区数据中心部署一台EMC 480统一存储平台,配置一个大容量光纤磁盘存储设备,作为整个系统数据集中存储平台。 2.在嘉禾院区数据中心部署一台EMC 480统一存储系统,配置一个大容量光纤磁盘存储设备,作为整个平台的灾备存储平台。 ) 3.两地各部署两台EMC RecoverPoint/SE RPA,采用CLR技术,即CDP(持续数据保护)+CRR(持续远程复制),实现并发的本地和远程数据保护。 4.在东风东院区数据中心本地采用EMC RecoverPoint/SE CDP(持续数据保护)技术实现本地的数据保护。. 5.两地采用EMC RecoverPoint/SE CRR(持续远程复制)技术,实现远程的数据保护。由于两地之间专线的带宽有限,可以采用EMC Recoverpoint/SE异步复制技术,将东风东院区数据中心EMC480上的数据定时复制到嘉禾院区数据中心。根据带宽的大小,如果后期专线带宽有所增加,RecoverPoint会自动切换同步、异步、快照时间点三种复制方式,尽最大可能保证数据的零丢失。 1.3本地数据数据保护(CDP)设计

数据容灾备份中心建设方案书.

https://www.sodocs.net/doc/2415808392.html, - 国内第一医疗信息化网站,为业内人士提供最强大的交流共享平台 ×××单位 数据容灾备份中心建设方案书(DSG-Realsync数据复制容灾技术) 迪思杰(北京)数码技术有限公司 DSGdata Inc.

迪思杰(北京)数码技术有限公司 目录 第一部需求分析 (7) 1 容灾项目建设需要注意的几大问题 (9) 1.1 为什么要建容灾系统 (9) 1.2 容灾不能替换备份 (9) 1.3 容灾项目需要多大的投资? (11) 1.4 容灾项目如何解决投资回收问题 (12) 1.5 容灾项目对生产系统性能的影响 (13) 1.6 选择什么容灾技术能保证项目实施成功? (13) 2 容灾项目的建设原则“平战结合” (14) 2.1 变成本中心为利润中心 (14) 2.2 核心业务的灾备平台 (14) 2.3 业务负载分担 (14) 2.4 容灾技术的推荐“DSG RealSync” (15) DSG-RealSync数据同步复制容灾产品应用案例 (15) DSG-SnapAssure高速备份产品应用案例 (16) 2.5 DSG RealSync数据库复制产品的特点 (17) 3 容灾技术对比和分析 (20) 3.1 容灾产品概述 (20) 3.2 基于异地备份技术实现容灾的分析 (20) 3.3 基于应用层容灾技术的分析 (21) 3.4 基于磁盘阵列复制容灾技术的分析 (21) 3.5 基于存储卷复制容灾技术的分析 (23) 3.6 基于虚拟化存储技术的分析 (24) 3.7 基于Oracle DataGuard容灾技术的分析 (25) 3.8 DSG Realsync容灾技术的分析 (27) 第二部整体方案设计 (30) 4 方案设计(案例:西部证券) (31) 4.1 需求分析 (31) 4.2 DSG灾备一体化产品线 (31) 4.3 Snapassure与Realsync的关系 (31) 4.4 容灾技术的推荐 (32) 4.5 系统结构 (33) 4.6 实时复制软件realsync配置 (33) 4.7 定时备份软件snapassure配置 (34) 4.8 功能实现 (34) 4.9 性能和资源需求估算 (35) 4.9.1网络需求 (35) 4.9.2日志分析速度 (35) 4.9.3每秒钟复制的操作数 (35) 4.9.4复制数据延迟 (35) 4.9.5CPU资源占用 (36)

双机容灾系统建设方案建议书

双机容灾系统建设方案建议书

第一章纯软方式双机热备系统建设方案提示:因为纯软双机只支持Windows平台,如不改变现有服务器的Linux操作系统,请跳过本章 由于上述的建设双机系统的必要性和双机系统数据的重要性,就需要搭建一个非常适合双机系统运行和数据存储的平台,以此来保障双机系统安全、高效的运行。只有这样,才能充分发挥双机系统在企业的核心作用,从而全面提升企业的竞争力和生产力。 结合贵方的需求和现状,我们设计一款纯软方式的解决方案,以供参考。 图4.1 拓扑结构图 1.1方案描述 使用用户原有得两台业务服务器,构成一对双机。因为纯软双朵只支持Windows平台,所以需要将两台服务器全部改成Windows 系列操作系统,将原Oralce 9i数据库改成Windows平台版本Oracle数据库。两台服务器通过双机软件组成双机热备系统,双机中任何一台机器发生故障的情况下,由备机接管相应的IP地址、主机名、数据库服务及业务应用。 硬件要求:两台服务器的配置相同(CPU、内存和磁盘分区的类型、大小),

同时配置双网卡 网络环境要求:两台服务器安装相同的操作系统、数据库、应用程序及服务将两台服务器部署到企业的以太网中,分别将两台服务器中的一块网卡设为业务网卡,并分配固定的物理IP地址。将两台服务器的另一块网卡作为心跳网卡,通过一条心跳线相连。两台服务为一主一从的关系,主机为当前业务服务器,从机为灾备业务服务器。主机上的业务数据会被双机软件通过心跳线同步到从机。 通过双机软件虚拟一个业务IP地址,对外提供服务。绑定在主机IP址上,当主机发生故障时,再自动切换到从机物理IP地址上进行绑定。同时,接管数据库服务,应用程序服务等相关业务服务。双机软件以一定时间频率通过心跳线从主机发送验证信息到从机,检验主机是否运行正常,当主机的IP地址,数据库服务,数据存储区三者之一发生问题,双机软件会认为主机业务已停止,需要从机进行业务接管。同时停止主机的服务,开启从机服务。 当主机需要进行系统维护,系统升级,硬件安装等操作时,可手动将业务切换到从机上。当操作完成时,再将数据同步回主机并将业务切换到主机上。 1.2本方案采用双机软件的特性 ●双机软件的产品和服务能够使信息不间断,它通过一个接近无缝的 处理来管理和保护贯穿一个企业的数据。 ●基于双机软件的高可用性和高可靠性,我们选择它作为核心信息系 统和数据库服务器的双机切换软件。

灾备方案

1.数据中心容灾备份解决方案 随着社会的发展和科技的进步,政府日常工作越来越依赖于数据处理来进行,政务系统的连续性依赖于数据中心系统的稳定运行。然而,灾难就像灰尘一样伏击在运营环境周围,政务系统的数据中心可能正在一个充满风险和威胁的环境下运行。如果不能对这些风险采取有效治理,一旦数据由于某种原因丢失,就很有可能对政府的日常工作造成严重的影响。如果核心数据丢失,将会使得某些核心功能陷入瘫痪,造成不可估量的损失。因此,保证政务的连续性和数据的高可靠性和可用性,已经成为政府部门在数据中心建设中,必须要考虑的问题。 1.1灾备解决方案原则 首先,在制定容灾系统方案的过程中要考虑的就是容灾系统建设对原有业务系统带来的影响。比如,采用数据复制技术对系统I/O带来的延迟,应用数据同步对日常业务处理系统带来的压力等。因此,企业要通过周密的测试和分析来规避容灾系统建设时带来的这些风险,以保证业务系统不会因容灾系统的建设而出现在处理性能上下降的问题。 第二,数据状态要保持同步。为保证在灾难发生时,业务可以成功地切换到备份中心,就必须保证容灾系统数据同步机制的可靠性。因此,建立可靠的数据同步校验机制是必须的; 同时,还要考虑建立定时的、自动的数据同步核查对比机制,以检验两个中心数据的一致性,这是数据容灾工作中非常重要的一部分。 第三,容灾系统的日常维护工作要尽可能轻,并能承担部分业务处理和测试的工作。容灾系统的维护和管理是容灾切换成功的重要保证,在系统建设中,就必须要考虑系统的维护管理流程。生产中心任何业务处理过程的改变都必须完整地复制到备份中心; 所有新业务系统上线时,必须通知备份中心,并在备份中心配置好数据同步机制; 对原程序的改动也必须保证两个中心同时上线。 第四,系统恢复时间要尽可能短。容灾系统主要是为了实现在主中心系统发生灾难时,可以在规定时间切换到备份中心,保证数据不会丢失,并且继续向用户提供服务。但往往在灾难发生时,主要技术人员不能及时到达现场,为了顺利实现系统间的切换,应该让系统切换操作尽可能地简单; 并建立固定化的、标准化的切换流程,要求维护人员在切换演习时严格按照流程的指导步骤进行操作。 第五,可实现部分业务子系统的切换和回切。当人事变动、业务变化、IT设施变化以及其 他可能引起恢复规划文档失效的变化发生时,应及时更新各恢复规划文档,并在必要时启动模拟测试或演习,确保业务连续性系统的工作能力。 第六,技术方案选择要遵循成熟稳定、高可靠性、可扩展性、透明性的原则。目前,国际上比较成熟的容灾技术包括:SAN/NAS技术、远程镜像技术、虚拟存储、基于IP的SAN互连技术以及快照技术等。其中基于IP的SAN远程数据容灾备份技术应用比较广泛,其是利用基于IP的SAN的互连协议,将主数据中心SAN中的信息通过现有的TCP/IP网络,远程复制到备份中心的SAN中的。当备份中心存储的数据量过大时,可利用快照技术将其备份

点对点容灾解决方案 华为

华为点对点容灾解决方案技术建议书 临时方案 华为技术有限公司 2014年5月12日

目录 1项目概述 (4) 1.1项目需求 (4) 1.2华为点对点整体方案优势 (4) 2点对点容灾方案设计方案 (5) 2.1总体技术方案 (5) 2.1.1点对点容灾方案架构与组件介绍 (5) 2.1.2阵列异步远程复制子方案 (8) 2.1.3阵列同步远程复制子方案 (10) 2.1.4基于VIS的本地高可用子方案 (12) 2.1.5 Oracle Rac的持续化数据保护子方案 (14) 2.2设备选型方案 (14) 2.2.1华为T系列存储系统 (14) 2.2.2 Huawei Tecal RH2285 V2服务器 (18) 2.2.3 OceanStor VIS6600T (21) 2.2.4 OceanStor ReplicationDirector管理软件 (24) 3配置方案 (28)

术语说明

1 项目概述 1.1 项目需求 对于现行业务没有容灾保护的场景下,在面对灾难时,将面临数据丢失,业务长时间中断的风险。传统的单一站点的各种弊端和诸多不便,主要体现在以下几方面: ?难以有效保护核心数据:单一站点在面对突发灾难或者突发事件的时候,无法保护数据的完整性。一旦整个站点在地震等大规模灾难中彻底损坏,客户将面临数据全部丢失的风险。 ?难以提供合理的RPO和RTO:单一站点存在无法提供一个较小的RPO和RTO的限制。 ?系统维护困难:在对单一站点进行维护时,会面临长时间停止业务的风险,对于一个企业来说,业务停止的时间越长,企业受到的影响就越大。 ?难以有效利用现有存储资源:企业在更换高性能存储设备后,如何有效的利用陈旧设备是一个难题。 ?难以实现本地存储高可用:目前的单一存储很难提供有效的本地高可用支持,通过上层的应用软件来实现会影响上层主机性能。对于企业来说,如何在不影响业务运行性能的情况下实现本地存储的高可用是一个难题。 针对上述问题,建议使用点对点容灾方案。点对点容灾方案帮助企业解决数据保护问题,降低系统维护难度,充分利用企业资源,通过存储虚拟化技术实现本地高可用,为实现企业业务稳定、可靠的运行提供整体的解决方案。 1.2 华为点对点整体方案优势 华为公司针对本项目提供了端到端的解决方案。华为主要优势如下: (1)主要部件使用华为自研产品(如存储,交换机,服务器等),兼容性好,高性能,高可靠。 (2)提供较少的数据丢失(3S-5S的RPO)。华为能够提供秒级的RPO保护,为客户提供更好的数据保护。 (3)对华为的存储设备可以做到高中低端互通,充分的利用企业闲置的旧存储设备。 (4)通过存储虚拟化技术(VIS)实现本地存储系统的高可用,提高系统的可靠性。消除单阵列宕机时,业务无法运行的风险。 (5)对于光网络环境使用华为业界领先的光网络技术,提供高质量、高速率、远距离的数据传输支持。 (6)通过统一的管理软件,实现对整个存储资源的集中管理,大大提升管理系统的效率。 使用华为点对点整体方案,能够帮助企业: (1)保护核心业务数据

分布式存储系统设计方案——备份容灾

分布式存储系统设计方案——备份容灾 在分布式存储系统中,系统可用性是最重要的指标之一,需要保证在机器发生故障时,系统可用性不受影响,为了做到这点,数据就需要保存多个副本,并且多个副本要分布在不同的机器上,只要多个副本的数据是一致的,在机器故障引起某些副本失效时,其它副本仍然能提供服务。本文主要介绍数据备份的方式,以及如何保证多个数据副本的一致性,在系统出现机器或网络故障时,如何保持系统的高可用性。 数据备份 数据备份是指存储数据的多个副本,备份方式可以分为热备和冷备,热备是指直接提供服务的备副本,或者在主副本失效时能立即提供服务的备副本,冷备是用于恢复数据的副本,一般通过Dump的方式生成。 数据热备按副本的分布方式可分为同构系统和异步系统。同构系统是把存储节点分成若干组,每组节点存储相同的数据,其中一个主节点,其他为备节点;异构系统是把数据划分成很多分片,每个分片的多个副本分布在不同的存储节点,存储节点之间是异构的,即每个节点存储的数据分片集合都不相同。在同构系统中,只有主节点提供写服务,备节点只提供读服务,每个主节点的备节点数可以不一样,这样在部署上会有更大的灵活性。在异构系统中,所有节点都是可以提供写服务的,并且在某个节点发生故障时,会有多个节点参与故障节点的数据恢复,但这种方式需要比较多的元数据来确定各个分片的主副本所在的节点,数据同步机制也会比较复杂。相比较而言,异构系统能提供更好的写性能,但实现比较复杂,而同构系统架构更简单,部署上也更灵活。鉴于互联网大部分业务场景具有写少读多的特性,我们选择了更易于实现的同构系统的设计。 系统数据备份的架构如下图所示,每个节点代表一台物理机器,所有节点按数据分布划分为多个组,每一组的主备节点存储相同的数据,只有主节点能提供写服务,主节点负责把数据变更同步到所有的备节点,所有节点都能提供读服务。主节点上会分布全量的数据,所以主节点的数量决定了系统能存储的数据量,在系统容量不足时,就需要扩容主节点数量。在系统的处理能力上,如果是写能力不足,只能通过扩容主节点数来解决;而在写能力不足时,则可以通过增加备节点来提升。每个主节点拥有的备节点数量可以不一样,这在各个节点的数据热度不一样时特别有用,可以通过给比较热的节点增加更多的备节点实现用更少的资源来提升系统的处理能力。

数据中心容灾备份方案

数据中心容灾备份方案 Company number:【WTUT-WT88Y-W8BBGB-BWYTT-19998】

数据保护系统 医院备份、容灾及归档数据容灾 解决方案 1、前言 在医院信息化建设中,HIS、PACS、RIS、LIS 等临床信息系统得到广泛应用。医院信息化 HIS、LIS 和 PACS 等系统是目前各个医院的核心业务系统,承担了病人诊疗信息、行政管理信息、检验信息的录入、查询及监控等工作,任何的系统停机或数据丢失轻则降低患者的满意度、医院的信誉丢失,重则引起医患纠纷、法律问题或社会问题。为了保证各业务系统的高可用性,必须针对核心系统建立数据安全保护,做到“不停、不丢、可追查”,以确保核心业务系统得到全面保护。 随着电子病历新规在 4 月 1 日的正式施行,《电子病历应用管理规范(试行)》要求电子病历的书写、存储、使用和封存等均需按相关规定进行,根据规范,门(急)诊电子病历由医疗机构保管的,保存时间自患者最后一次就诊之日起不少于 15 年;住院电子病历保存时间自患者最后一次出院之日起不少于30 年。

2、医院备份、容灾及归档解决方案 针对医疗卫生行业的特点和医院信息化建设中的主要应用,包括:HIS、PACS、RIS、LIS 等,本公司推出基于数据保护系统的多种解决方案,以达到对医院信息化系统提供全面的保护以及核心应用系统的异地备份容灾 数据备份解决方案 针对于医院的 HIS、PACS、LIS 等服务器进行数据备份时,数据保护系统的备份架构采用三层构架。 备份软件主控层(内置一体机):负责管理制定全域内的备份策略和跟踪客户端的备份,能够管理磁盘空间和磁带库库及光盘库,实现多个客户端的数据备份。备份软件主服务器是备份域内集中管理的核心。 客户端层(数据库和操作系统客户端):其他应用服务器和数据库服务器安装备份软件标准客户端,通过这个客户端完成每台服务器的 LAN 或 LAN-FREE 备份工作。另外,为包含数据库的客户端安装数据库代理程序,从而保证数据库的在线热备份。

浅谈容灾与容灾方案设计

浅谈容灾与容灾方案设计 自从有了信息技术以来,信息系统面临的各种故障和灾难就从来没有停止过。在企业信息化进程不断加快的今天,保持业务的持续性是企业用户进行数据存储时必须考虑的重要问题。灾难的出现,可能导致生产停顿、客户满意度降低,企业的竞争力会因此大打折扣。震惊世界的“9.11” 事件让全世界都看到了金融、电信企业在灾难中遭受的巨大损失。08年的南方雪灾和汶川地震告诉我们,灾难就在我们身边,容灾系统的建设已经刻不容缓。 容灾是指为了保证关键业务和应用在经历各种灾难后,仍然能够最大限度的提供正常服务所进行的一系列系统计划及建设行为,业务连续性是容灾的最终建设目标。一般来说容灾是一个宏观的概念,IT领域所说的灾备、灾难恢复等只是容灾的一部分,主要讨论数据和信息系统保护的问题,或者说是容灾整体框架中的技术基础部分。容灾技术的进步和需求的增长是企业信息化发展的必然结果,同时也反映了信息化系统及数据对个人、企业和国家的重要程度的不断提升。 信息系统容灾建设的目标是提高信息系统抵御灾难和重大事故的能力,减少意外情况发生所造成的损失,减轻对企业和社会带来的不良影响。容灾与数据安全性是密切相关的,数据的安全性是实现业务连续性的基础。统计结果表明,在过去5年内,全球93%的公司有过丢失重要数据而造成业务损失的经历,72% 的业务没有可靠的业务连续性计划,只有18%的最终用户的数据得到了可靠保护。 虽然已经认识到数据安全的重要性,但很多企业在如何建立容灾系统的问题上却存在种种疑惑。我国在实施容灾工程方面尚处于初级阶段,某些已经建成并投入使用的容灾系统,功能单一,而且存在投入成本高、投资回报率低、容灾数

XXXX公司Oracle数据库异地容灾方案

XXXX公司Oracle数据库异地容灾方案 2011年08月29日

1、公司简介 XXXX公司。 2、项目背景 ●XXXX有两个数据中心。 ●两个基地之间使用TCP/IP网络进行连接。 ●生产业务系统的后台数据库为Oracle。 ●数据库服务器操作系统为Windows。 ●数据库目前总体数据量约为2.4T。 ●生产系统为双机容错架构。 ●希望远程数据中心成为容灾中心。 3、解决方案 3.1方案原理 这是一个很典型的应用场景,用户对RPO、RTO的要求比较高,用户希望数据丢失尽可能少,恢复尽可能快。可是,要实现这一愿望,传统的容灾方案都是采用昂贵的存储设备或卷管理软件来实现,投入相当惊人,用户很难接受!CommVault的CDR连续数据复制是一个性价比很高的解决方案,工作原理如下图所示:

这个Oracle远程容灾方案的设计思想是:在容灾系统初始化时或备份系统被破坏时,利用备份和恢复来传送数据库的DBF文件;在数据库日常工作时,利用CDR来时复制数据库日志文件,并将日志回滚到备份数据中(对于双机架构来说,原理相同,所需模块相同, 如图生产主机可为双机或集群架构)。系统的数据流如下图所示:

3.2实施过程 在这个方案中,我们采用了CommVault的备份技术和CDR技术,数据共有4份冗余,除了生产数据外,还有容灾数据,本地备份和异地备份数据;这里需要注意的是,在两个数据中心的数据库都是使用本地数据为业务系统提供服务,并且将数据在两个数据中心之间相互复制,以便达到两个数据中心互为容灾中心的目的。整个容灾系统的建立共分4个阶段: ●初始化阶段:通过备份+恢复方式,在容灾站点生成初始化数据 ●容灾复制阶段: 1.通过CDR复制交易日志 2.自动回滚日志实现数据库容灾 3.每天做异地数据库的冷备份 4.每天做本地数据库的热备份 ●灾难重建阶段: 如果数据崩溃,由于本地和异地都有灾备数据,通过本地的直接恢复实现本地网络 的灾难数据重建,避免在远程网络上传送大量的初始化数据 ●容灾演练阶段: 将容灾站点的数据库打开,就可以使用了。恢复正常工作方式,只要将灾备的数据 恢复,然后回滚以前的日志数据,就能恢复容灾复制阶段。 4、技术要点 在这4个阶段中,充分利用了CommVault的独特技术: ●CDR复制:连续数据复制,复制数据库交易日志。 ●断点续传:支持从中断点继续传送。 ●GridStor:支持多个介质服务器使用不同地区的数据源,这样就不需要通过网络来 回传送大量的数据。 ●自动恢复和回滚:支持以时间或者自动的方式,恢复和回滚日志或其它数据,而不 需要手工执行。 ●辅助拷贝:支持将本地的备份数据复制到异地,实现异地的灾备。

相关主题