搜档网
当前位置:搜档网 › 第六章 灾难恢复与业务连续性计划

第六章 灾难恢复与业务连续性计划

第六章 灾难恢复与业务连续性计划
第六章 灾难恢复与业务连续性计划

第六章:灾难恢复与业务连续性计划

C6-1 During an audit, an IS auditor notes that an organization's business continuity plan (BCP) does not adequately address information confidentiality during a recovery process. The IS auditor should recommend that the plan be modified to include:

A .the level of information security required when business recovery procedures are invoked.

B. information security roles and responsibilities in the crisis management structure.

C. information security resource requirements.

D. change management procedures for information security that could affect business continuity arrangements.

6-1 在审计中,一个IS审计师注意到一个组织的业务持续计划不能适当解决恢复过程中的信息机密性。这个IS审计师应该推荐计划被修改:

A.当业务恢复进程被启用时信息安全所需要的层次

B.在危机管理架构中的信息安全角色和责任

C.信息安全资源需求

D.信息安全的改变管理进程可能会影响业务持续安排

A Business should consider whether information security levels required during recovery should be the same, lower or higher than when business is operating normally. In particular, any special rules for access to confidential data during a crisis need to be identified. The other choices do not directly address the information confidentiality issue.

答案A解析:.业务应该考虑是否在恢复时需要相同的安全级别,或者比平时的低或者高。特别的是,一些在紧急时候访问加密数据的规则需要被辨识。其他选项并不直接解决信息机密性问题。

C6-2 During a disaster recovery test, an IS auditor observes that the performance of the disaster recovery site's server is slow. To find the root cause of this, the IS auditor should FIRST review the:

A. event error log generated at the disaster recovery site.

B. disaster recovery test plan.

C. disaster recovery plan (DRP).

D. configurations and alignment of the primary and disaster recovery sites.

6-2 在灾难恢复测试中,一个IS审计师发现灾难恢复站点的服务器缓慢,为了找出根本原因,信息系统审计师应该首先审查:

A.灾难备份点的事件错误日志生成

B.灾难备份测试计划

C.灾难备份计划

D.配置并确保主站与和灾难备份点保持一致

D Since the configuration of the system is the most probable cause, the IS auditor should review that first. If the issue cannot be clarified, the IS auditor should then review the event error log. The disaster recovery test plan and the disaster recovery plan (DRP) would not contain information about the system configuration.

答案D 解析:.既然系统配置是最可能的原因,IS审计师因为首先检查。如果问题不能被澄清,IS审计师检查事件错误日志。灾备测试计划灾备计划不应该包含系统配置的信息。

C6-3 Which of the following is the GREA TEST risk when storage growth in a critical file server is not managed properly?

A. Backup time would steadily increase

B. Backup operational cost would significantly increase

C. Storage operational cost would significantly increase

D. Server recovery work may not meet the recovery time objective (RTO)

6-3 当一个关键的文件服务器存储量增长没有被合理的管理,哪个是最大的风险?

A.备份时间将持续增加

B.备份操作成本将会显著增加

C.存储操作成本将会显著增加

D.服务器恢复将不能满足RTO的要求

D In case of a crash, recovering a server with an extensive amount of data could require a significant amount of time. If the recovery cannot meet the recovery time objective (RTO), there will be a discrepancy in IT strategies. It's important to ensure that server restoration can meet the RTO. Incremental backup would only take the backup of the daily differential, thus a steady increase in backup time is not always true. The backup and storage costs issues are not as significant as not meeting the RTO.

答案D解析:.如果发生故障,恢复具有一些数据的服务器将会需要一个明显的时间点。如果恢复不能满足目标恢复时间,将会在IT策略上产生差异。保证服务器恢复符合R TO非常重要。增量备份将只备份每天的差异,这样一个稳固的备份时间增长是不正确的。备份和存储成本并不象不符合RTO那样重要。

C6-4 An organization has a recovery time objective (RTO) equal to zero and a recovery point

objective (RPO) close to I minute for a critical system. This implies that the system can tolerate:

A. a data loss of up to 1 minute, but the processing must be continuous.

B. a 1-minute processing interruption but cannot tolerate any data loss.

C. a processing interruption of I minute or more.

D. both a data loss and a processing interruption longer than I minute.

6-4 一个组织有一个目标恢复时间接近于0,一个目标恢复点至于关键系统接近1分站。这暗示系统能承受:

A.数据丢失最多1分钟,但是进程是持续的

B.1分钟的进程中断,但是不能容忍数据丢失

C.一分钟或更多的进程中断

D.数据丢失和进程中断都超过1分钟

A The recovery time objective (RTO) measures an organization's tolerance for downtime and the recovery point objective (RPO) mea sures how much data loss can be accepted. Choices B, C and D are incorrect since they exceed the RTO limits set by the scenario.

答案A解析:.RTO衡量一个组织对宕机时间的容忍度,RPO衡量多少数据丢失可以被接收。选项B,C,D不正确因为他们超过了这个场景的RTO限制。

C6-5 Which of the following issues should be the GREA TEST concern to the IS auditor when reviewing an IT disaster recovery test?

A. Due to the limited test time window, only the most essential systems were tested. The other systems were tested separately during the rest of the year.

B. During the test it was noticed that some of the backup systems were defective or not working, causing the test of these systems to fail.

C. The procedures to shut down and secure the original production site before starting the backup site required far more time than planned.

D. Every year, the same employees perform the test. The recovery plan documents are not used since every step is well known by all participants.

6-5 以下哪个问题是IT审计师审计灾备测试时最关注的?

A.因为测试时间限制,只对最必要的系统进行测试,其他系统可在年内其他时间进行测试。

B.在测试中注意到一些备份系统有缺陷或无法正常工作,导致系统测试失败。

C.在开始备份前关闭和保护原站点的程序所需时间远远超过计划所需要的时间。

D.每年都是由相同的人员进行测试。因为这些人员了解每一个步骤,所以没有使用恢复计划文档。

D A disaster recovery should not rely on key staff since a disaster can occur when they are not available. It is common that not all systems can be tested in a limited test time frame. It is important, however, that those systems which are essential to the business are tested. and that the other systems are eventually tested throughout the year. One aim of the test is to identify and replace defective devices so that all systems can be replaced in the case of a disaster. Choice B would only be a concern if the number of discovered problems is systematically very high. In a real disaster, there is no need for a clean shutdown of the original production environment since the first priority is to bring the backup site up.

答案D 解析:一个灾备测试应该测试计划,进程,人力和IT系统。所以,如果计划没有被使用,它的准确性和充分性不能被保证。灾备计划不能只依靠关键的职工,因为灾难发生时,可能他们不在。普遍的是并不是所有系统可以在一个限制的时间点内被测试。重要的是那些系统被在年内被完全测试。测试的目标是辨识和替代有缺陷的设备,所有的系统在发生灾难时被替换。B 只关注发现问题的系统比较高。在一个真的灾难中,没有需要关闭初始点,因为第一步是启用备份点。

C6-6 The frequent updating of which of the following is key to the continued effectiveness of a disaster recovery plan (DRP)?

A. Contact information of key personnel

B. Server inventory documentation

C. Individual roles and responsibilities

D. Procedures for declaring a disaster

6-6维护一个持续有效的灾备计划,需要对以下哪项信息进行持续更新?

A.主要负责人的联系信息

B.服务器库存文件

C.个人角色与责任

D.宣告灾难的进程

A In the event of a disaster, it is important to have a current updated list of ersonnel who are key to the operation of the plan. Choices B. C and D would be more likely to remain stable overtime.

答案A解析:.万一发生灾难,重要的是有更新的主要负责操作计划的人。B,C,D将更维持稳固的超时。

C6-7 An organization has outsourced its wide area network (W AN) lo a third-parly service provider. Under these circumstances, which of the Ibllovving is the PRIMARY task the IS auditor should perform during an audit of business continuity (BCP) and disaster recovery planning (DRP)?

A. Review whether the service providers BCP process is aligned with the organization's BCP and contractual obligations.

B. Review whether the service level agreement (SLA) contains a penalty clause in case of failure to meet the level of service in case of a disaster.

C. Review the methodology adopted by the organization in choosing the service rovider.

D. Review the accreditation of the third-party service provider's staff.

6-7 一个组织把它的广域网服务外包给第三方服务商。在这样的情况下,哪个是IS审计师在审计BCP和DRP时的主要职责?

A.检查服务提供的BCP是否符合公司的BCP和合同责任

B.检查是否SLA包含惩罚如果发生灾难时没有达成服务级别承诺

C.检查组织选择服务提供商的方法

D.检查第三方服务提供商职工的资质

A Reviewing whether the service provider's business continuity plan (BCP) process is aligned with the organization's BCP and contractual obligations is the correct answer since an adverse effect or disruption to the business of the service provider has a direct bearing on the organization and its customers. Reviewing whether the service level agreement (SLA) contains a penalty clause in case of failure to meet the level of service in case of a disaster is not the correct answer since the presence of penalty clauses, although an essential element of a SLA, is not a primary concern. Choices C and D are possible concerns, but of lesser importance.

答案A解析:检查是否服务提供的BCP符合公司的BCP和合同责任是正确的,因为服务提供商的反作用和中断会给组织和客户有很直接的影响。检查SLA是否有惩罚条款并不是正确的,因为惩罚条款是SLA的必要因素,并不是主要的考虑。C和D不重要。

C6-8 An IS auditor can verify that an organization's business continuity plan (BCP) is effective by reviewing the:

A.alignment of the BCP with industry best practices.

B.results of business continuity tests performed by IS and end-user personnel.

C.off-site facility, its contents, security and environmental controls.

D.annual financ ial cost of the BCP activities versus the expected benefit of implementation of the plan.

6-8 一个IS审计师可以通过以下哪一种方式验证组织的BCP有效?

A.BCP符合行业最佳实践

B.IS审计师和终端用户对业务持续性进行测试的结果

C.离线备份设施、相关内容、安全和环境控制

D.每年的BCP财务成本对比实施计划的预期收益

B The effectiveness of the business continuity plan (BCP) can best be evaluated by reviewing the results from previous business continuity tests for thoroughness and accuracy in accomplishing their stated objectives. All other choices do not provide the assurance of the effectiveness of the

答案B解析:BCP的有效性可以通过以前业务持续测试的结果于他们声明的目标之间的检查来评估。所有其他的都不提供BCP有效性的保证。

C6-9 A live test of a mutual agreement for IT system recovery has been carried out. including a four-hour test of intensive usage by the business units. The test has been successful, but gives only partial assurance that the:

A. system and the IT operations team can sustain operations in the emergency environment.

B. resources and the environment could sustain the transaction load.

C. connectivity to the applications at the remote site meets response time requirements.。

D. workflow of actual business operations can use the emergency system in case of a disaster.

6-9 一个在线测试It系统恢复的相互协定被执行。包括一个4小时的业务单元密集使用的测试。测试成功了,但是只给了部分保证:

A.系统和IT操作队伍在紧急环境下的持续操作

B.资源和环境支撑交易符合。

C.远程站点的应用链接符合响应时间需求

D.实际业务操作流程可以在发生灾难时使用紧急系统。

A The applications have been intensively operated, therefore choices B, C and D have been actually tested, but the capability of the system and the IT operations team to sustain and support this environment (ancillary operations, batch closing, errorcorrections, output distribution, etc) is only partially tested.

答案A解析:.应用是集中的操作,所以B,C,D都已经被实际测试,但是系统的能力和IT操作队伍支撑环境只是被部分的测试。

C6-10 To optimize an organization's business contingency plan (BCP), an IS auditor should recommend conducting a business impact analysis (BIA) in order to determine:

A. the business processes that generate the most financial value for the organization and therefore must be recovered first.

B. the priorities and order for recovery to ensure alignment with the organization's business strategy.

C. the business processes that must be recovered following a disaster to ensure the organization's survival.

D. the priorities and order of recovery which will recover the greatest number of systems in the

shortest time frame.

6-10为优化一个组织的业务应急计划,一个信息系统审计师应该推荐使用业务影响分析的方法来决定:

A.产生组织的最大经济价值的业务流程应该首先被恢复。

B.恢复的优先权和顺序,以保证与组织的业务战略调整一致。

C.必须在灾难后恢复的事关组织的生存业务流程。

D.恢复的优先权和顺序,以尽可能地在最短的时间内恢复更多的系统。

C To ensure the organization's survival following a disaster, it is important to recover the most critical business processes first. It is a common mistake to overemphasize value (A) rather than urgency. For example, while the processing of incoming mortgage loan payments is important from a financial perspective, it could be delayed for a few days in the event of a disaster. On the other hand, wiring funds to close on a loan, while not generating direct revenue, is far more critical because of the possibility of regulatory problems, customer complaints and reputation issues. Choices B and

D are not correct because neither the long-term business strategy nor the mere number of recovered systems has a direct impact at this point in time.

答案C 解析:保证灾难后组织的生存,重要的是恢复最关键的商业流程。这是个普遍的错误过分强调价值(A)凌驾于紧要度。举例,财务方面抵押借款的收入是很重要的,如果有灾难它可以被延迟几天。另一方面,在线的现金支付,并不产生直接的收入,但是它因为法规,客户投诉和名誉问题而非常关键。选项(B)和(D)并不正确,因为长期商业策略和纯粹的恢复系统都没有直接的影响。

C6-11 A financial services organization is developing and documenting business continuity measures. In which of the following cases would an IS auditor MOST likely raise an issue?

A. The organization uses good practice guidelines instead of industry standards and relies on external advisors to ensure the adequacy of the methodology.

B. The business continuity capabilities are planned around a carefully selected set of scenarios which describe events that might happen with a reasonable probability.

C. The recovery time objectives (RTOs) do not take IT disaster recovery constraints into account, such as personnel or system dependencies during the recovery phase.

D. The organization plans to rent a shared alternate site with emergency workplaces which has only enough room for half of the normal staff.

6-11一个金融服务机构正在开发并记录业务持续措施。下面哪一个选项是信息系统审计师最有可能提出问题的?

A.该机构用良好的实践指南来代替行业标准,并依赖外部顾问来保证方法的适用性。

B.业务持续能力根据一套经仔细选择的方案计划,该方案描述了事件可能发生的合理可能性。

C.恢复时间目标并不考虑信息灾难恢复的限制,像恢复阶段个人与系统的向关性。

D.该机构计划租用一个共享交替的场地,那里有应急工作场所,刚好可以容纳一半的普通员

工。

B It is a common mistake to use scenario planning for business continuity. The problem is that it is impossible to plan and document actions for every possible scenario. Planning for just selected scenarios denies the fact that even improbable events can cause an organization to break down. Best practice planning addresses the four possible areas of impact in a disaster: premises, people, systems, suppliers and other dependencies. All scenarios can be reduced to these four categories and can be handled simultaneously. There are very few special scenarios which justify an additional separate analysis. It is a good idea to use best practices and external advice for such an important topic, especially since knowledge of the right level of preparedness and the judgment about adequacy of the measures taken is not available in every organization. The recovery time objectives (RTOs) are based on the essential business processes required to ensure the organization's survival, therefore it would be inappropriate for them to be based on IT capabilities. Best practice guidelines recommend having 20-40% of normal capacity available at an emergency site: therefore, a value of 50% would not be a problem if (here arc no additional factors.

答案B 解析:这是个普遍的错误用远景规划去应对业务持续。问题是不可能为每个可能的情况做计划和记录步骤。最佳实践是四个可能被灾难影响的方面:设备,人,系统,给养和其他。所有的情况都可以被缩减到这四个类别并且被同时处理。有一些极少数的特别情况被证明特别的分析。这是个好主义去用最佳实践和外部建议为如此重要的话题,特别因为正确的知识准备层次和对于措施的判断并不是每个组织都具备。恢复时间目标是基于企业生存的必须业务流程,所以并不适合基于IT能力。最佳实践推荐正常能力的20%-40%做紧急备份,所以50%并不是个问题。

C6-12 A medium-sized organization, whose IT disaster recovery measures have been in place and regularly tested for years, has just developed a formal business continuity plan (BCP). A basic BCP tabletop exercise has been performed successfully. Which testing should an IS auditor recommend be performed NEXT to verify the adequacy of the new BCP?

A.Full-scale test with relocation of all departments, including IT, to the contingency site

B.Walk-through test of a series of predefined scenarios with all critical personnel involved

C.IT disaster recovery test with business departments involved in testing the critical applications

D.Functional test of a scenario with limited IT involvement

C6-12 一个中等组织,它的灾难恢复措施已经就绪并在数年中经过了有规律的测试,该组织刚刚开发了一个正式的业务持续性计划,并成功进行了基本的桌上模拟演练(沙盘推演),

IS 审计师应该建议下一步采用什么测试来验证新的业务持续性计划的有效性?

A. 全面测试,将所有部门包括IT部门重新部署到应急场所

B. 在所有关键人员参与下穿行测试(走查)一系列事先定义的场景

C. 在业务部门的参与下的IT 灾难恢复测试以测试关键程序

D. 在IT部门有限的参与下的某一场景的功能测试

D After a tabletop exercise has been performed, the next step would be a functional test, which includes the mobilization of staff to exercise the administrative and organizational functions of a recovery. Since the IT part of the recovery has been tested for years, it would be more efficient to verify and optimize the business continuity plan (BCP) before actually involving IT in a full-scale test. The full-scale test would be the last step of the verification process before entering into a regular annual testing schedule. A full-scale test in the situation described might fail because it would be the first time that the plan is actually exercised, and a number of resources (including IT) and time would be wasted. The walk-through test is the most basic type of testing. Its intention is to make key staff familiar with the plan and discuss critical plan elements, rather than verifying its adequacy. The recovery of applications should always be verified and approved by the business instead of being purely IT-driven. A disaster recovery test would not help in verifying the administrative and organizational parts of the BCP which are not IT-related.

答案D解析:在完成桌上模拟演练(沙盘推演)之后,下一步应该是功能测试,包括动员员工演习恢复计划的行政和组织功能。由于恢复计划的IT部分已经经过了多年的测试,因此在真正包含IT的全面测试之前验证并优化业务持续性计划会更有效。在上面描述的情况下实施全面测试可能会失败,因为这是该计划第一次被实际演练,并且会造成一定的资源(包括IT资源)和时间的浪费。穿行测试(走查)是测试最基本的类型,它的目的是使关键员工熟悉计划并讨论计划的关键环节,而不是验证计划的有效性。程序的恢复应当被业务部门验证和批准而不是纯粹IT部门驱动。灾难恢复测试不能不能帮助验证业务恢复计划(BCP)的行政和组织部分,这部分是与IT无关的。

C6-13 Which of the following is the MOST important consideration when defining recovery point objectives (RPOs).

A.Minimum operating requirements

B.Acceptable date loss

C.Mean time between failures

D.Acceptable time for recovery

C6-13 下面哪一项是确定恢复点目标(RPO)时最重要的考虑?

A最小操作需求

B 可接受的数据丢失

C 宕机之间的平均时间

D 可接受的恢复时间

B Recovery time objectives (RTOs) are the acceptable time delay in availability of business operations, while recovery point objectives (RPOs) are the level of data loss/reworking an organization is willing to accept. Mean time between failures and minimum operating requirements help in defining recovery strategies.

答案B解析:恢复时间目标(RTO)是可接受的业务操作宕机的时间,而恢复点目标是组

织能够接受的数据丢失的水平。宕机之间的平均时间和最小操作需求对于确定恢复策略有所帮助。

C6-14 To address an organization’s disaster recovery requirements. Backup intervals should not exceed the:

A.service level objective (SLO).

B.Recovery time objective (RTO).

C.Recovery point objective (RPO).

D.Maximum acceptable outage (MAO).

C6-14 为了强调组织的灾难恢复需求,备份间隔不应该超过:

A. 服务水平目标(SLO)

B. 恢复时间目标(RTO)

C. 恢复点目标(RPO)

D. 最大可接受损耗(MAO)

C The recovery point objective (RPO) defines the point in time to which data must be restored after a disaster so as to resume processing transactions. Backups should be performed in a way that the latest backup is no older than this maximum time frame. If service levels are not met, the usual consequences are penalty payments, not cessation of business. Organizations will try to set service level objectives (SLOs) so as to meet established targets. The resulting time for the service level agreement (SLA) will usually be longer than the RPO. The recovery time objective (RTO) defines the time period after the disaster in which normal business functionality needs to be restored. The maximum acceptable outage (MAO) is the maximum amount of system downtime that is tolerable. It can be used as a synonym for RTO. However, the RTO denotes an objective/target, while the MAO constitutes a vital necessity for an organization’s survival.

答案C解析:恢复点目标以时间的形式定义了灾难发生后为了继续处理交易所必须修复的数据点。备份应该以最新的备份的时间不大于这个最大时间段的方式进行。如果服务水平没有达到,最通常的结果是罚金,不是业务的停止。组织应该努力建立服务水平目标以满足已制定的目标。服务水平协议(SLA)的效果时间通常比恢复点目标(RPO)要长。恢复时间目标定义了灾难发生后普通业务功能被恢复所需要的时间段。

最大可接受损耗(MAO)是可接受的系统宕机时间的最大值,它可以恢复点目标(RTO)通用,但是,RTO表示一个目标,而MAO组成了系统幸存的关键必要性。

XX财产保险股份有限公司信息系统灾难恢复预案

XX财产保险股份有限公司信息系统灾难恢复预案 2014-11

目录 1目标与范围 (2) 1.1灾难的定义............................................................................ 错误!未定义书签。 1.2容灾目标 (4) 1.3容灾范围 (5) 1.4灾难恢复演习执行周期 (5) 1.5灾难恢复计划启动决策流程 (5) 1.6灾难声明的内容 (5) 1.7灾难恢复指挥中心和异地灾备中心 (5) 2组织与职责 (6) 2.1团队组织图 (6) 2.2灾难恢复团队 (6) 2.3全部成员通讯录 (17) 3紧急响应流程 (17) 3.1灾难预警 (17) 3.2人员疏散 (17) 3.3损害评估 (17) 3.4研判和灾难宣告 (17) 4恢复及重续运行流程 (18) 4.1恢复 (18) 4.2重续运行 (18) 5灾后重建和回退 (19) 5.1生产系统的重建工作流程 (19) 5.2专业技术保障........................................................................ 错误!未定义书签。 5.3通信保障................................................................................ 错误!未定义书签。

1目标与范围 1.1灾难恢复预案中的相关术语 1)灾难备份中心backup center for disaster recovery 用于灾难发生后接替主系统进行数据处理和支持关键业务功能运作的场所,可提供灾难备份系统、备用的基础设施和专业技术支持及运行维护管理能力,此场所内或周边可提供备用的生活设施。 2)灾难备份系统backup system for disaster recovery 用于灾难恢复目的,由数据备份系统、备用数据处理系统和备用的网络系统组成的信息系统。 3)业务连续管理business continuity management 为保护组织的利益、声誉、品牌和价值创造活动,找出对组织有潜在影响的威胁,提供建设组织有效反应恢复能力的框架的整体管理过程。包括组织在面临灾难时对恢复或连续性的管理,以及为保证业务连续计划或灾难恢复预案的有效性的培训、演练和检查的全部过程。 4)业务影响分析business impact analysis 分析业务功能及其相关信息系统资源、评估特定灾难对各种业务功能的影响的过程。 5)关键业务功能critical business functions 如果中断一定时间,将显著影响组织运作的服务或职能。 6)数据备份策略data backup strategy 为了达到数据恢复和重建目标所确定的备份步骤和行为。通过确定备份时间、技术、介质和场外存放方式,以保证达到恢复时间目标(3.17)和恢复点目标(3.18)。 7)灾难disaster 由于人为或自然的原因,造成信息系统严重故障或瘫痪,使信息系统支持的业务功能停顿或服务水平不可接受、达到特定的时间的突发性事件。通常导致信息系统需要切换到灾难备份中心运行。

灾难恢复计划

灾难恢复计划 一、灾难的定义 灾难分为自然灾害和非自然灾害。 自然灾害是指由火灾、地震等引发的一系列灾害直接导致公司的业务中断、电力故障、网络故障等。 非自然灾害是指人为的造成的如服务器断电、软件错误、人为故意破坏、恶意代码、木马植入、恐怖袭击等。 二、灾难恢复项目小组的制定和职能 1.管理组:统筹规划,指挥各小组按照既定计划进行执行。 2.部门恢复组:负责制定各部门情况制定应急备案,确定各部门数据和财产的保护方式并执行保护,确定各部门数据的恢复方式并执行恢复。 3.计算机恢复组:负责对全公司范围内的计算机故障进行排除、恢复范围包括系统、必备办公软件。 4.损坏评估组:负责对公司损失的重要数据、财务进行总体评估。并针对相应损失的财产进行汇总并结合拥有的保险进行申报。 5.安全组:负责灾难发生后的人员、数据、财务的安全进行保护。并制定相应的安全策略。 6.设备支持组:负责对公司服务器、网络设备、交换机的故障进行排除,制定相应解决重建方案。 7、数据恢复组:负责对公司各平台数据进行恢复,并制定相应数据恢复方案。

8、市场和客户关系组:负责对外进行信息发布、制定相应应急措施应对客户疑问等。 各小组共同职能: a)负责计划的执行 b)与其它组之间进行信息交流,监督计划的测试和执行 c)所有或是某一个成员可能领导特定的组 d)协调恢复过程 e)评估灾难,执行恢复计划,联系组长 f)监控并记录恢复的过程 三、业务恢复流程 (一)自然灾害引起的灾难恢复流程 由自然灾害引起的灾难往往影响较大,可能会直接导致一些基础设施的无法使用,甚至会对导致人员减少。因此对于自然灾害引发的灾难恢复流程相对特殊且繁琐。 1.数据抢救 灾难发生时,需在保证人身安全的情况对公司的重要数据进行抢救,抢救的范围主要包括:记录公司重要信息的文件、资料,存储公司重要数据的磁带,存放重要数据的硬盘、服务器。此过程需由安全组进行统筹指挥,按照既定的计划执行,各组成员、公司员工必须服从安全组的统一调度和指挥。 2.损坏评估及启动应预案 灾难发生后各小组需根据情况汇报损失情况给损坏评估组,

业务连续性与灾难恢复计划

业务连续性与灾难恢复计划 1. 业务连续性计划 包括灾难恢复计划:用来恢复不可用的设备,包括重新再新的地点安装操作系统作业计划:恢复发生的同时业务单位应所进行的作业 重建计划:用来将运营恢复正常,无论是旧设备修复还是采购新设备 业务连续性计划的第一步要进行风险与业务影响分析(BIA),它可以揭示每一种风险 可能对业务造成的损失,风险要首先被确定,然后再进行业务影响分析。 一个好的BCP,应当综合考虑关键信息系统处理设施和终端 用户的业务功能两方面的内容。 BCP按其生命周期分为以下几个阶段: , 业务不间断和灾难恢复计划的创建 BCP意外管理:微小事件,小事件,大事件,重大事件 小、大和重大事件应该被记录、分类、跟踪直到被纠正或解决。 事件的变化可以是突然的,一个大事件可以迅速的消失了,也可以演变成为重大 的事件 , 业务影响分析(BIA) 执行BIA有许多方法,比较流行问卷调查法、拜访关键用户、把IT人员和终端 用户召集在一起,讨论得到结论,确定各种级别的中断对业务的影响程度。 在BIA中应该注意以下问题: a) 组织的主要业务流程是什么

一个流程是否是关键流程,取决于运行时间和运行模式。 b) 与组织关键业务流程相关的关键信息资源是什么 可能存在于以下几个方面:接受客户支付的系统、生产系统、支付员工工资系统、成品分发系统。 c) 关键恢复时间周期是多长 , 运行分类和重要性分析 分类一般包括: 关键的:可忍耐的时间为几个小时到一天 重要的:通常一天到五天 敏感的:允许一周以上 不敏感的:对业务流程没有什么影响,几乎没有什么恢复成本。 恢复战略的参数: a) 恢复点目标(RPO):通过业务运行中断的情况下可接受的数据损失来决定, 指出了最早可接受的数据恢复时间点。例如,如果业务流程在灾难发生前最多能忍受4个小时的数据损失,那么,在灾难发生前,最近的可用备份在时间上不超过四个小时就可以了。 b) 恢复时间目标(RTO):要通过业务运行中断的情况下可接受的停机时间来决 定,它指明了灾难发生后必须对业务进行恢复的最早时间点。 c) 中断时间窗(Interruption window):组织可以等待的自失效点时刻到关键服 务/应用恢复的时刻。该时间窗之后,如果未能恢复运转的损失会越来越大。

灾难恢复管理流程

罕王实业集团有限公司 信息中心 灾难恢复管理流程 编号及版本号:HK 责任部门:信息中心 发布(施行)日期:2015年1月 4 日编制人: 审核人: 批准人:

《信息中心灾难恢复管理流程》履历表 表单编号: 第一章总则 目的 确保公司业务的持续性,避免人为和自然灾害带来的风险。具体目标如下:1)将信息系统运行的中断降到最低; 2)限制中断和损害的范围;

3)将中断的经济影响降到最低; 4)预先建立备用操作方法; 5)培训人员处理紧急过程; 6)提供顺利快速的恢复服务。 适用范围 本流程适用于信息中心负责的所有信息系统。 职责 1 表 2 表 第二章细则 流程说明 资产列表 在此列出了公司业务持续所必须依赖的信息系统和重要数据,下列各表应6个月核查一次。1)基础硬件:包括服务器、磁盘阵列、个人计算机、打印机、传真机、磁带机、常规数据 表 2 表 3 表

灾难恢复计划 自然灾害 这里的自然灾害指造成公司所在建筑物毁灭性损失的火灾、地震、水灾、地面塌陷等灾害。自然灾害在灾难分类中出现几率最小,但造成损失是最大的。流程说明如下: 1)确定损失情况。 自然灾难发生后,灾难恢复小组成员立即建立联系,具体了解公司的损失情况,了解的范围包括:人员、物理设备、数据。 小组成员根据了解到的损失情况编制《损失一览表》。 2)通知用户服务中断。 损失情况了解清楚后,灾难恢复小组成员讨论预估的恢复时间。 灾难恢复小组组长根据《损失一览表》确定有哪些服务不能正常提供,马上联系用户通知服务中断并告知估计的恢复时间。通知用户可以通过电话联系、张贴通知、电子邮件等方式。 3)联系保险公司。 发布服务中断的信息后,灾难恢复小组组长根据《损失一览表》中记录的损失情况检查是否有财产投保,如果有则应马上联系保险公司申请理赔。 4)联系服务商。 灾难恢复小组确定损失情况后,小组成员根据《损失一览表》中记录的设备损失列表,联系该设备的提供商,重新购置或者租用设备,并确定设备的到货日期和地点。 5)确定新的机房和办公地点。 如果公司原先的机房和办公地点已经无法使用,灾难恢复小组组长应向总裁提出申请,确定新的机房和办公地点。 6)安装调试新的物理设备。 新设备到货后,灾难恢复小组组长部署新设备的安装和调试工作。安装调试任务明确后,灾难恢复小组组长应和各信息系统管理员确定完成部署的时间,如果完成时间和前期通知用户的时间不同,应通知用户最后确定的系统恢复时间。 7)恢复系统数据。 新设备安装完成后,IT(网络、操作系统)工程师取出备份的最新数据,执行数据恢复操作,各应用系统的数据恢复参照各应用系统的操作手册。 8)告知用户服务已恢复。 系统恢复运行后,恢复小组组长向用户发布通知,告知系统已经恢复运行。 9)填写《灾难恢复报告》。 流程图请见图1。 电力故障 UPS能够避免短时间的电力中断故障造成的损失。这里的电力故障指超出UPS承受范围的大范围停电事故,这种长时间的停电会造成业务停止和数据的丢失。流程说明如下: 1)确定恢复时间。 IT(网络、操作系统)工程师在明确电力中断故障后,立即联系电力供应部门,了解电力故障的原因,确定电力恢复的时间。并立即通知各信息系统管理员。 2)关闭设备。 IT(网络、操作系统)工程师在UPS供电期内关闭所有服务器设备,防止断电造成损失。3)通知用户。 系统管理员通知用户因电力故障服务中断,并告知用户恢复的大概时间。通知的方式可以是电话、张贴通知、邮件等。 4)启动服务器。 在电力供应恢复正常后,IT(网络、操作系统)工程师按照手册启动设备,并通知各个应用管理员检查各自负责的应用系统是否已经正常启动。如果应用管理员发现应用程序没有

灾后的恢复计划

灾后的恢复计划 1、0生产厂房经修复后,有资质的建筑结构监测部门鉴定达到安全使用标准,取得合格的鉴定报告。 2、0生产设备、设施找相关行业部门鉴定和修复后,经地方安监局鉴定达到国家安全生产标准。 3、0企业环保设施经修复后须由环保局进行验收,取得合格的验收报告方可投入生产。 4、0配电设备、设施经抢建修复,具备安全通电条件,并经供电单位验收合格方可进行使用。具备上述条件以后,由企业向供电局上报生产用电计划。未经供电局批准同意的用电企业,各供电企业不能擅自提供生产用电给工厂。 4、1 准备活动 4、1、1 成立紧急事故反应小组(ERT)/灾难恢复小组为准备一份成功的灾难恢复计划,应成立一个小组。在完成计划之后,他们必须至少每年一次或在发生灾难时召开会议。成员将包括ERT加上MIS、生产、物料、设备、环境/健康/安全、保安、销售、工程和品质部门的人员。 4、、1、2 生产现场资源的确认应制定一份重要设备和资源清单。如果工厂被部分或完全破坏,这份清单将有助于说明哪些需迅速替补。清单应包含人员、文件、产品和原材料等的说明,它可能从现时文件中汇编出来。

4、、1、3 影响评估对上述关键类资源可能出现的灾难场景进行评估,评估可能会出现什么情况。这有助于确定需在何处加强准备。评估可以不同的形式进行。 4、1、4 影响最小化计划被确定为“关键”而且被影响或破坏可能性较大的资源准备一份影响最小化计划。例如:可包括更多的培训,分散在其他地方的备份文件和设备,一些化学品和废物周围的双重或三重保护,更新ER计划,防震装置和额外的火灾抑制系统(喷洒装置、软管盘、灭火器)。 4、1、5 恢复计划如果发生严重灾害,某些影响也无法减小或避免。在这些情况下,公司所能做的就只有准备一些恢复计划,并挑出最好的部分。 4、1、6 电话号码和联系人在灾难恢复计划中列出比急救计划中更多的紧急联系号码。紧急联系电话号码应记录在灾难恢复计划中,除ER计划中已确定的,还应包括下列:组长、主管、经理、高层管理、老板 4、1、7 日常检查灾难恢复过程中公司的状况、资源和供给每天都在变化。因而应经常检查公司资源,灾难恢复供给以及计划。随着资源发生变化,相应在的灾难恢复计划也应改变。 4、1、8 灾难恢复指挥部应设立一个场外灾难恢复指挥部。它可位于公司其他地方,只要离灾难发生地无危害的距离。 4、1、9 预防性保养如果生产环境的设备保养得好,可能使它们安全通过灾难,并对生产和环境造成较小影响。

计算机系统灾难恢复计划

嘉兴冠誉时装有限公司 计算机系统灾难恢复计划 一、灾难的定义 灾难分为自然灾害和非自然灾害。 自然灾害是指由火灾、地震等引发的一系列灾害直接导致公司的业务中断、电力故障、网络故障等。 非自然灾害是指人为的造成的如服务器断电、软件错误、人为故意破坏、恶意代码、木马植入、恐怖袭击等。 二、灾难恢复项目小组的制定和职能 1.管理组:统筹规划,指挥各小组按照既定计划进行执行。 2.部门恢复组:负责制定各部门情况制定应急备案,确定各部门数据和财产的保护方式并执行保护,确定各部门数据的恢复方式并执行恢复。 3.计算机恢复组:负责对全公司范围内的计算机故障进行排除、恢复范围包括系统、必备办公软件。 4.损坏评估组:负责对公司损失的重要数据、财务进行总体评估。并针对相应损失的财产进行汇总并结合拥有的保险进行申报。 5.安全组:负责灾难发生后的人员、数据、财务的安全进行保护。并制定相应的安全策略。 6.设备支持组:负责对公司服务器、网络设备、交换机的故障进行排除,制定相应解决重建方案。 7、数据恢复组:负责对公司各平台数据进行恢复,并制定相应数据恢复方案。 8、市场和客户关系组:负责对外进行信息发布、制定相应应急措施应对客户疑问等。 各小组共同职能: a)负责计划的执行 b)与其它组之间进行信息交流,监督计划的测试和执行 c)所有或是某一个成员可能领导特定的组 d)协调恢复过程 e)评估灾难,执行恢复计划,联系组长 f)监控并记录恢复的过程 三、业务恢复流程 (一)自然灾害引起的灾难恢复流程 由自然灾害引起的灾难往往影响较大,可能会直接导致一些基础设施的无法使用,甚至会对导致人员减少。因此对于自然灾害引发的灾难恢复流程相对特殊且繁琐。 1.数据抢救 灾难发生时,需在保证人身安全的情况对公司的重要数据进行抢救,抢救的范围主要包括:记录公司重要信息的文件、资料,存储公司重要数据的磁带,存放重要数据的硬盘、服务器。此过程需由安全组进行统筹指挥,按照既定的计划执行,各组成员、公司员工必须服从安全组的统一调度和指挥。 2.损坏评估及启动应预案 灾难发生后各小组需根据情况汇报损失情况给损坏评估组,损坏评估组根据汇总信息进行消息告知披露。披露损坏信息包括: a)公司重要生产、监视测量、办公设备

系统灾难恢复计划

一、目的 建立一个可行的灾难恢复计划,在发生重大事件时启动该该灾难恢复计划使经济损失降到最低,对关键人员进行培训,随时准备应对灾难,执行有效的恢复动作,恢复关键业务操作。 二、范围 本计划适用于华为RTC业务 三、程序 3.1 IT 关键接入点 3.1.1 计算机基本系统 ?工厂基本数据信息 ?每日做本地备份 ?一个小型PC平台服务器 ?数据库可以加载到不同的PC系统并持续运行 ?在杭州东信放置一个备份服务器 3.1.2 Email 公司总部有专用的邮箱服务器提供给员工与客户、员工和供应商通信 ?可通过本地ISP 3.2任务和职责

3.2.1灾难声明 以下人员是由公司授权认定,可声明公司灾难。 授权人员名单 3.2.2 华为客户联系人 3.2.3 灾难沟通流程 灾难事件发生时,将会公布以下时间表: ?在发布紧急声明时,所有受影响客户将会被通知,并立刻给出一个有效的影响评价。?所有受影响的客户在1小时内通知到位(或更快,依事件而定) ?和每个客户的沟通根据他们选择的形式(例如,座机,手机,Email) 3.2.4 各业务持续性团队 3.3恢复程序 业务持续性/恢复行动:客户记录

恢复行动:方法检索试验程序和服务手册 第二设施联系人 3.4:测试程序 :3.4.1 引言 定期测试很重要,因为它证实了备份和恢复程序的有效性。预期的系统和网络环境会改变。 3.4.2 测试方法 ?测试恢复必须成功地完成与硬件,系统,网络,应用程序,数据恢复和应用程序的功能验证的业务或应用支持区域内的恢复时间框架中对业务影响评估过程的定义。测试失败必须重新测试,对于区域业务在一个时间范围内成功完成是令人愉快的。当一个系统、应用程序或网络经历了一个高程度的变换,频繁测试将被考虑。 ?测试事件日志必须包含时间框架,遇到的问题和改进建议。该日志应该扩展开,对事件回顾并用于问题的跟踪和解决。

业务持续性计划

业务连续性计划 业务连续性计划概述 业务连续性计划是一套基于业务运行规律的管理要求和规章流程,使一个组织在突发事件面前能够迅速作出反应,以确保关键业务功能可以持续,而不造成业务中断或业务流程本质的改变。 业务连续性是指企业有应对风险、自动调整和快速反应的能力,以保证企业业务的连续运转。为企业重要应用和流程提供业务连续性应该包括以下三个方面。 1.高可用性(High availability)。它是指提供在本地故障情况下,能继续访问应用的能力。无论这个故障是业务流程、物理设施,还是IT软硬件故障。 2.连续操作(Continuous operations)。它是指当所有设备无故障时保持业务连续运行的能力。用户不需要仅仅因为正常的备份或维护而需要停止应用的能力。 3.灾难恢复(Disaster Recovery)。它是指当灾难破坏生产中心时,在不同的地点恢复数据的能力。 同时,上述三个部分不是相互孤立的,是相互关联,而且有交叉的。 区分业务连续性和灾难恢复是很必要的。严格地说,灾难恢复是恢复数据的能力,是业务连续性计划的一部分。 让业务连续性计划成为企业变化管理文化的一部分。在制定企业业务连续性计划之后,不要把这个计划放在一边。要确保该计划的切实可行,就需要把它变成活动的文档。如果企业的业务模式发生了变化,或是业务过程进行了重新设计,或是发生突发状况时的重要联系人不再为公司工作,旧的计划就需要及时进行更新。当有变化时,每个员工都应该问问自己该变化会对业务连续性计划中涉及到自己的部分会产生怎样的影响。 业务连续性计划的重要性 现在的社会特别是经济社会对网络的依赖日益加深,传统的备份恢复式安全计划已经无法保证企业业务的连续运行。 业务连续性计划正是因此而生,它根据业务流程而非针对技术进行制订,有助于建立起更具统筹能力的安全管理制度。据Gartner Group的调查结果显示,如果企业的大型数据中心和信息基础设施停止运行10日以上,超过百分之三十的企业在一个季度内倒闭,而接近90%的企业在一年内倒闭。 这些数据说明了保证业务连续有效的运行对企业来说是多么重要,同时也可以看出企业花费大量的资金于业务连续性计划最核心的原因。 业务连续性计划的基本要素 BCP的基本要素 笼统地说,BCP的目标只有一个,那就是确定并减少危险可能带来的损失,有效地保障业务的连续性。而有关BCP的一些特定目标我们将在以下各个部分中加以描述。BCP实施的最终结果是: ?一组防范危险的评测指标; ?一支执行团队,在经过培训后可以处理各种危险事件; ?一套计划,提供危险发生时的路线图。该计划应该是充分和完备的,必须详细落实到该计划实施范围内的每一个单位、人员或设备。 每个企业所制定的BCP都应该有每个企业或者所处行业独有的特色,彼此之间不会完全一致,但大致上说来,一个完备的BCP主要是由以下一些关键部分构成的:一、危险评估

银行数据中心业务连续性与灾难恢复管理

银行数据中心业务连续性与灾难恢复管理 数据中心应将应急计划和灾难恢复管理纳入业务连续性管理框架,建立应急计划和灾难恢复管理组织架构,明确应急计划和灾难恢复管理机制和流程。 1、风险分析与评估 数据中心应统筹规划业务连续性计划和灾难恢复工作,通过业务影响分析识别和评估业务运营中断所造成的影响和损失,明确业务连续性管理重点,明确灾难恢复策略、预案并及时更新。根据业务重要程度实现差异化管理,确定各业务恢复优先顺序和恢复等级。商业银行应当至少每三年开展一次全面业务影响分析,并形成业务影响分析报告。 2、灾备等级划分 针对不同等级的灾难事件分别制定应急处理流程,明确紧急情况发生时的紧急处理流程和业务恢复机制等。根据系统的重要程度和场景,建立不同等级的灾难备份环境(建立同城备份或异地备份),从而提高银行数据中心对较大规模灾难事件的抵御能力。 3、确定RTO和RPO 应当综合分析重要业务运营中断可能产生的损失与业务恢复成本,结合业务服务时效性、服务周期等运行特点,确定重要业务恢复时间目标(业务RTO)、业务恢复点目标(业

务RPO)。原则上,重要业务恢复时间目标≦4h,重要业务恢复点目标≦0.5h。 4、建立业务连续性计划和灾难恢复预案 银行应当根据本行业务发展的总体目标、经营规模以及风险控制的基本策略和风险偏好,确定适当的业务连续性管理战略。业务连续性计划和灾难恢复预案,应包括但不限于以下内容:业务连续性计划和灾难恢复指挥小组和工作人员组成及联系方式、汇报路线和沟通协调机制、灾难恢复资源分配、基础设施与信息系统的恢复优先次序、灾难恢复与回切流程及时效性要求、对外沟通机制、最终用户操作指导,及第三方技术支持和应急响应服务等内容。 5、灾难恢复资源与培训 数据中心为应急计划和灾难恢复提供充分的资源保障,包括基础设施、网络通信、运维及技术支持人力资源、技术培训等。 6、建立应急计划和灾难恢复有效性测试验证机制 针对应急计划和灾难恢复的预案、流程进行测试验证,验证的内容包括支持应急计划和灾难恢复系统的硬件环境、系统环境、业务功能、业务数据等验证。 7、应急计划和灾难恢复演练 数据中心每年至少进行一次重要信息系统专项灾备切换演练,每三年至少进行一次重要信息系统全面灾备切换演练,

重要信息系统灾难恢复指南-2007年版

重要信息系统灾难恢复指南 作者:国务院信息化办公室 引言 灾难恢复是确保信息和信息系统安全的一项重要措施。遵从重要信息系统灾难恢复指南的要求,是做好重要信息系统灾难恢复工作的基础。 本指南用于规范和指导重要信息系统的使用和管理单位对信息系统灾难恢复的规划和准备工作。本指南主要从灾难恢复规划的管理、灾难恢复的需求分析、灾难恢复等级的确定、灾难恢复等级的实现、灾难恢复预案的制订、落实和管理等方面,对灾难恢复的规划和准备活动的规范化要求进行全面描述。本指南还以规范性附录的形式对灾难恢复的等级划分进行了描述,并以资料性附录的形式对灾难恢复预案的框架进行了说明。 1-1 1 范围 本指南规定了对重要信息系统的灾难恢复应遵循的基本要求。 本指南适用于指导重要信息系统的使用和管理单位(以下简称“单位”)进行灾难恢复的规划和准备工作,对重要信息系统灾难恢复规划项目的审批和监督管理也可参照使用。 2 规范性引用文件 下列文件中的条款通过本指南的引用而成为本指南的条款。凡是注日期的引用文件,其随后所有的修改单(不包含勘误的内容)或修订版均不适用于本指南,然而,鼓励根据本指南达成协议的各方研究是否可适用这些文件的最新版本。凡是不注日期的引用文件,其最新版本适用于本指南。GB/T 5271.1—2000 信息技术词汇第1 部分:基本术语 GB/T 5271.9—2000 信息技术词汇第9 部分数据通信 GB/T 5271.12—2000 信息技术词汇第12 部分外围设备 GB/T 5271.20—94 信息技术词汇20 部分系统开发 GB/T 2887-2000 电子计算机场地通用规范 3 术语和定义 GB/T 5271.1—2000 第1 部分、GB/T 5271.9—2000 第9 部分、GB/T 5271.12—2000 第12 部分和GB/T 5271.20—94 第20 部分确立的术语和定义,以及下列术语和定义适用于本指南。 3.1灾难disaster 由于人为或自然的原因,造成信息系统运行严重故障或瘫痪,使信息系统支持的业务功能停顿或服务水平不可接受、达到特定的时间的突发性事件,通常导致信息系统需要切换到备用场地运行。 3.2灾难恢复disaster recovery 将信息系统从灾难造成的故障或瘫痪状态恢复到可正常运行状态,并将其支持的业务功能从灾难

灾难恢复计划

灾难恢复计划 编制: 批准: 版本: 日期:2010年12月

版本历史记录............................................................. 错误!未定义书签。1.简介.................................................................. 错误!未定义书签。 计划的使用........................................................... 错误!未定义书签。 灾难定义............................................................. 错误!未定义书签。 概述................................................................ 错误!未定义书签。 原则................................................................ 错误!未定义书签。2.恢复策略.............................................................. 错误!未定义书签。 自然灾难(包括:火、地震等等)...................................... 错误!未定义书签。 硬件故障............................................................ 错误!未定义书签。 软件故障............................................................ 错误!未定义书签。 病毒................................................................ 错误!未定义书签。3.职责.................................................................. 错误!未定义书签。 灾难恢复小组成员.................................................... 错误!未定义书签。 公司员工在灾难恢复时的职责........................................... 错误!未定义书签。4.信息系统详细内容及设备列表............................................ 错误!未定义书签。 网关、防火墙服务器................................................... 错误!未定义书签。 域服务系统........................................................... 错误!未定义书签。 文件服务器系统....................................................... 错误!未定义书签。 4.邮件、防病毒系统................................................... 错误!未定义书签。 5. QAD linux 系统.................................................... 错误!未定义书签。 6 QAD windows 系统................................................... 错误!未定义书签。 7备份系统........................................................... 错误!未定义书签。 网络服务设备列表..................................................... 错误!未定义书签。5.备份.................................................................. 错误!未定义书签。 系统配置备份......................................................... 错误!未定义书签。 数据资料备份......................................................... 错误!未定义书签。 备份步骤............................................................. 错误!未定义书签。6.灾难恢复内容及顺序.................................................... 错误!未定义书签。 主要恢复内容......................................................... 错误!未定义书签。 主要软件及系统恢复步骤.............................................. 错误!未定义书签。 恢复备份数据的条件:................................................. 错误!未定义书签。 恢复时间及顺序....................................................... 错误!未定义书签。7.主要硬件及软件供应商联系方式.......................................... 错误!未定义书签。8.风险分析.............................................................. 错误!未定义书签。 风险等级:........................................................... 错误!未定义书签。 风险分析列表:....................................................... 错误!未定义书签。 风险评价............................................................. 错误!未定义书签。 降低风险的发生....................................................... 错误!未定义书签。9.培训.................................................................. 错误!未定义书签。

1-业务持续计划清单和灾难恢复计划清单

XXXX有限公司 文件編號: OP-25 發行版次: 1 共 8 頁第 1 頁題目:业务持续计划和灾难恢复计划 __________________________________________________________________________________ 文件編號:OP-25 發行版次: 1 生效日期:2012年12月1日 總頁數: 3 (包括本頁) 制定:_____________________ 日期:_____________________ (程序負責人) 確認:_____________________ 日期:_____________________ (管理者代表) 審批:_____________________ 日期:_____________________ (總經理) 印有受控文件章為受控文件, 請參閱受控版本文件。 受控印章

XXXX有限公司文件編號:OP-25 發行版次: 1 共 8 頁第 2 頁 1. 目的: 为保障在紧急状况下客户的生产供应不受影响,我们编制了这份《业务持续计划和灾难恢复计划》,目的在于对公司内可能发生的、影响生产的自然灾害及其他人力不可抗力因素,如火灾、断水、断电、台风、劳动力缺失、关键性设备实效等影响,制定应急及补救措施,维护生产活动的正常进行,保证客户产品的供应。 此程序适用于公司所有部门。 2. 定义: 2.1“自然灾害”是指在自然界发生的、具有一定破坏性的异常现象。自然灾害通 常以洪水、干旱、地震、台风等形式出现。 2.2“不可抗力事件”是指由自然或社会原因所造成的不可预见、无法避及控制的 客观事件。 3. 应急小组 3.1组织架构图

企业业务连续性和灾难恢复规划实施

企业业务连续性和灾难恢复规划实施 企业部署了全面的灾难恢复规划,而不到10%的中小企业拥有危机管理、应急措施、业务重组和业务恢复计划。 对于中小企业来说,部署灾难恢复计划是十分重要的。根据Gartner调查显示,五分之二的企业在五年内都经历过至少一次严重灾难。此外,灾难的发生频率比我们想象中的还要高,因为大约80%的应用程序停工是人为的或者进程出错造成的,而不是因为灾难或者技术故障。 设置一个停机时间限制 当我们在部署灾难恢复计划时,最开始的目标应该是确定恢复点目标和恢复时间目标。灾难恢复点目标(RPO)指明了可以允许的数据丢失范围,而恢复时间目标(RTO)则是应用程序可以允许的停工时间范围,即根据可承受的最长停电时间来确定。 如果灾难真的发生了,那么你的公司可以承受多长时间呢?一个小时?一天?还是一个星期?那些需要立即恢复运行的公司必须投入更多的资金来进行灾难恢复部署,而那些几天内仍然可以继续运行的公司则可以投入较少的资金。同样来说,较高的灾难恢复点目标相对来说更加昂贵,但是中小企业必须权衡预防性支出与重要数据丢失带来的潜在高额费用之间的关系。认真确定灾难恢复点目标和恢复时间目标能够帮助你合理分配资源,而不会浪费成本。 如果你的公司对于确定灾难恢复点目标和恢复时间目标,那么就可以使用业务影响分析(BIA)。业务影响分析方法依据的基本假设条件就是,公司的每一个因素都依赖于任何其他因素的持续运行,但是有些因素比其他因素要更加重要。业务影响分析优先考虑了关键任务数据和系统,它能够帮助公司在考虑灾难性事件时将资源进行合理分配。BIA可以让IT经理和中小企业业主清楚地看到,如果他们不部署灾难恢复计划,他们将可能损失的成本价值。

灾难恢复计划

灾难恢复计划 文件编码(008-TTIG-UTITD-GKBTT-PUUTI-WYTUI-8256)

灾难恢复计划一、灾难的定义 灾难分为自然灾害和非自然灾害。 自然灾害是指由火灾、地震等引发的一系列灾害直接导致公司的业务中断、电力故障、网络故障等。 非自然灾害是指人为的造成的如服务器断电、软件错误、人为故意破坏、恶意代码、木马植入、恐怖袭击等。 二、灾难恢复项目小组的制定和职能 1.管理组:统筹规划,指挥各小组按照既定计划进行执行。 2.部门恢复组:负责制定各部门情况制定应急备案,确定各部门数据和财产的保护方式并执行保护,确定各部门数据的恢复方式并执行恢复。 3.计算机恢复组:负责对全公司范围内的计算机故障进行排除、恢复范围包括系统、必备办公软件。 4.损坏评估组:负责对公司损失的重要数据、财务进行总体评估。并针对相应损失的财产进行汇总并结合拥有的保险进行申报。 5.安全组:负责灾难发生后的人员、数据、财务的安全进行保护。并制定相应的安全策略。 6.设备支持组:负责对公司服务器、网络设备、交换机的故障进行排除,制定相应解决重建方案。 7、数据恢复组:负责对公司各平台数据进行恢复,并制定相应数据恢复方案。

8、市场和客户关系组:负责对外进行信息发布、制定相应应急措施应对客户疑问等。 各小组共同职能: a)负责计划的执行 b)与其它组之间进行信息交流,监督计划的测试和执行 c)所有或是某一个成员可能领导特定的组 d)协调恢复过程 e)评估灾难,执行恢复计划,联系组长 f)监控并记录恢复的过程 三、业务恢复流程 (一)自然灾害引起的灾难恢复流程 由自然灾害引起的灾难往往影响较大,可能会直接导致一些基础设施的无法使用,甚至会对导致人员减少。因此对于自然灾害引发的灾难恢复流程相对特殊且繁琐。 1.数据抢救 灾难发生时,需在保证人身安全的情况对公司的重要数据进行抢救,抢救的范围主要包括:记录公司重要信息的文件、资料,存储公司重要数据的磁带,存放重要数据的硬盘、服务器。此过程需由安全组进行统筹指挥,按照既定的计划执行,各组成员、公司员工必须服从安全组的统一调度和指挥。 2.损坏评估及启动应预案

信息系统灾难恢复方案

信息系统灾难恢复方案 第一章总则 第一条为规范并指导我公司生产系统灾难恢复工作,提高防范灾难风险的能力,保障持续运营,保护客户的合法权益,根据国家信息安全法律法规及有关规定,制定本预案。 第二条生产系统灾难恢复工作应坚持“统筹规划、平战结合、等级灾备”的原则,平衡成本与风险,确保工作的有效性。 第三条本指引所称灾难恢复为生产系统灾难恢复。灾难恢复工作是指,为保障生产系统持续运营,防范灾难风险并减轻灾难造成的损失和不良影响而开展的一系列工作,包括:组织机构设立和职责、灾难恢复需求分析、灾难恢复策略制定、灾难备份系统实施、灾难备份中心的建设与运行维护、灾难恢复预案管理、应急响应和恢复。 第二章总体工作要求 当生产系统及相关业务流程发生重大变更时,应立即启动灾难恢复需求的再分析,并根据最新的灾难恢复需求分析重审和修订灾难恢复策略。根据灾难恢复策略定期复审和调整灾难恢复技术方案、灾难恢复预案,并定期开展灾难恢复预案培训和演练工作。加强与业务密切相关的机构间的协调,共同评估面临的风险,协同制定灾难恢复策略,提高整体风险防范和灾难恢复能力。 第三章灾难恢复项目小组的制定和职能

1.管理组:小组人员:职责:统筹规划,指挥各小组按照既定计划进行执行。 2.部门恢复组小组成员:职责:负责制定各部门情况制定应急备案,确定各部门数据和财产的保护方式并执行保护,确定各部门数据的恢复方式并执行恢复。 3.计算机恢复组:小组成员:职责:负责对全公司范围内的计算机故障进行排除、恢复范围包括系统、必备办公软件。 4.损坏评估组: 小组成员: 职责:负责对公司损失的重要数据、财务进行总体评估。并针对相应损失的财产进行汇总并结合拥有的保险进行申报。 5.安全组: 小组成员职责:负责灾难发生后的人员、数据、财务的安全进行保护。并制定相应的安全策略。 6.设备支持组: 小组成员:职责:负责对公司服务器、网络设备、交换机的故障进行排除,制定相应解决重建方案。 7、数据恢复组: 小组成员:职责:负责对公司各平台数据进行恢复,并制定相应数据恢复方案。 8、市场和客户关系组: 小组成员:职责:负责对外进行信息发布、制定相应应急措施

灾难恢复规划

灾难恢复计划 一.日常备份检查 1.日常服务主机按时定期做备份,分为两类: 主机备份:主机备份应在每周,确认服务运行正常后,制定备份计划和类型,并指定备份时间应为网络最空闲时。在自动执行计划后,应确认备份是否完整,是否有错误 数据备份:数据备份应做每日备份,确定需要备份的数据库,制定每日备份和备份类型。每日,数据库管理人员应对前一日的备份,进行检查,确认备份是否成功完整。 2.日常备份检查 日常备份检查应由网络部主管人员不定期或定期指定检查,查看备份时间是否符合备份规定,备份文件是否完整,存放是否规整。 3.备份空间检查 日常由网络管理人员检查备份空间是否充足,如空间紧张,应提前把距离最远的备份文件,存放至指定存储介质中,网络部管理人员应对存储介质存放进行检查,查看存放空间是否达到防潮防磁,并对存储介质进行封存 二.灾难恢复小组: 组长:刘学辉 灾难鉴定:赵江涛刘峰任超 恢复实施人员:赵江涛任超 恢复后检查人员:刘学辉刘峰谢志祥赵江涛任超 灾难恢复制度: 1.灾难级别划分 A类:计算机软硬件故障 发生概率:对于企业,发生可能性最大。由于设备长时间运行,升级硬件所造成。状况有(服务停止,正常业务不能办理) B类:人为操作故障 发生概率:日常工作中员工对于本部门的资源进行更新或维护,由于不正当操纵或误操纵造成文件损坏或丢失。状况有(个别部门文件丢失,使得部门正常办公受到阻碍)

C类:资源不足引起的计划性停机 发生概率:由于操纵系统软件或硬件资源不足所造成的系统;服务宕机,造成的数据丢失或损坏。状况有(服务器无法正常提供服务,重启后无效,需要转移服务,升级维修服务器) 2.相对应级别的处置方法 当发生时。应先报告网络维护人员,由灾难鉴定小组进行灾难鉴定,确定灾难级别,上报灾难小组组长,并对灾难发生时间,解决方法,恢复时间进行记录。 2.1 发生A类灾难时,灾难鉴定人员确定灾难级别后,上报灾难恢复组组长,确定恢复方案,排除硬件原因,在主机正常启动后,检查缺失的文件或不能正常启动的服务,上报灾难组组长,并准备备份文件,进行恢复。 进行恢复后,由恢复后检查人员检查主机是否恢复正常服务,文件是否完整且可以被正常访问,检查无误后。上报灾难恢复小组组长,并对灾难恢复的过程进行记录。 2.2 发生B类灾难时,灾难发现人应及时上报网络部及灾难恢复小组组长,明确丢失的文件,确定文件丢失原因,并对丢失原因和责任人进行记录。由丢失文件部门提出书面“恢复文件申请”,由灾难鉴定确定丢失文件,在灾难恢复小组组长批准后,准备备份文件恢复。恢复后,由丢失文件所在部门进行确认。 2.3 当发生C类灾难,由灾难坚定人员确定主机故障,并上报灾难恢复小组组长: 2.3.1 确认为主机操纵系统故障或硬件资源不足所引起宕机时,先确认该主机是否为应用服务器(如是应用服务器,应先断开该主机的网络连接),如有需要,应及时转移服务,由其他服务器代为承接业务。故障主机再进行维修。 2.3.2 如确认系统不能正常运行,但通过短时间维护(不超过2小时)可以恢复正常,报请灾难恢复小组组长,并对原因进行说明。在得到批准后,实行对主机的全面恢复(在断开主机网络连接后,回复到最近一次的正常备份状态)。在恢复后由恢复检查人员对主机进行检查,确认主机确实恢复后,再接入网络,恢复后检查人员应在48小时内对恢复后的主机密切关注,确实恢复正常后,报告灾难恢复小组组长。并对主机恢复情况留有详细记录,以备后续检查

相关主题