什么是灾难恢复?

灾难恢复是一组预先安排好的计划和过程,允许公司在意外中断的情况下恢复其IT基础设施。它可能是火灾、地震等自然灾害引发的,也可能是水管破裂或空调故障等人为事故导致的。

作为一个组成部分业务连续性,灾难恢复侧重于确保关键技术服务仍然可用或迅速恢复。策略重点关注快速恢复硬件,应用和数据,目标是最大限度地减少负面事件的整体影响。

例如,灾难恢复解决方案可能用于:

  • 使重要系统恢复在线
  • 提供关键数据的实时复制
  • 替换丢失或无法访问的设备
  • 确保每个设备都可以运行用户所需的软件

无论是在房屋还是通过灾难恢复作为服务(DRAAS)解决方案,这个过程对于确保公司可以在发生紧急情况或失败的情况下继续运作。

你什么时候需要灾难恢复?

虽然“灾难”通常与飓风和龙卷风等最坏的情况联系在一起,但如果不加以解决,还有许多其他非极端情况可能会产生大规模影响——所有这些情况都可能在任何时候毫无预警地发生。

人为错误,黑客和硬件故障都可以触发灾难恢复的需要,以及软件故障,网络攻击和设备故障。在这些实例中的每一个中,该实例都有一个方法来防止数据丢失并最小化停机时间将确保业务尽可能接近正常。但是,除非提前准备过政策和程序,否则无法采取适当的行动。

你如何准备灾难恢复?

准备在紧急点击之前长时间准备恢复。该过程始于业务影响分析和风险评估。这两个步骤是制备过程的重要部分,因为他们帮助业务量化可能发生的财务和运营成本,这些费用应该产生灾难罢工。

当各利益相关者可以彻底评估安全,安全性,合规性和其他关键组件时,各种利益相关者可以彻底评估如何受各种事件的影响,最好在稳定时进行这些评估。

进行业务影响分析时,利益相关者将详细介绍一系列不同的灾难场景 - 然后预测最有可能随之而来的数据丢失和停机水平。

例如,灾难恢复测试团队可能首先回答以下问题:

  • 如果自然灾害导致整个物理设施的破坏会发生什么?
  • 如果发生中断,将防止哪些团队进行工作?
  • 如果一个大型风暴袭击总部,运作将如何影响作业?
  • 如果有全球性大流行,谁将需要在家工作 - 怎么样?

解决这些和其他“如果”场景允许组织识别关键业务功能,计算潜在损失,并确定在发生重大中断之前可以容忍多少停机时间。然后,可以使用业务影响分析来确定在突破阈值之前所需的硬件、设备和IT资源的全部范围。

这一分析的第二个基本要素是进行风险评估。通过进一步评估意外事件的潜在后果,企业可以识别特定的危险和网络基础设施漏洞,然后准备程序,将任何长期损害降到最低。

共同,业务影响分析和风险评估的结果可用于通知强大的灾难恢复策略。由于最终目标是尽可能快地恢复业务功能,因此这些准备步骤为关键:当必要时,他们将有助于确保可以在不延迟的情况下启动恢复过程。

了解Citrix灾难恢复解决方案如何确保您将永远准备好

Citrix Empowers员工从任何设备和网络上的任何位置牢固地工作 - 无论是在稳定的时候,何时灾难袭击。

什么是灾难恢复计划 - 它应该包括什么?

灾难恢复计划是一个完全记录的流程,概述了保护IT基础设施,企业资源和员工设备的特定行动 - 以及恢复和维护服务,因此工作人员可以尽快重新开始工作。这些是高度详细的计划,具体程序就在发生灾难时应该发生的事情。

更具体地说,大多数灾难恢复计划包括几个基本要素:

资产库存

这是一个对日常运营影响最大的公司设备和服务的优先列表,包括物理硬件和数字资产。通过按优先级列出这些资产,公司可以确保最重要的系统和服务能够快速恢复。当确定哪些IT资产支持关键业务活动时,确定恢复点和恢复时间目标也很重要:

  • 恢复点目标(RPO)指的是将需要恢复的数据的“年龄”,以便成功恢复。例如,如果公司决定RPO为三小时,则需要至少每三个小时进行数据备份。
  • 恢复时间目标(RTO)在需要进行文件恢复之前,业务可能会持久的最大停机量。如果业务影响分析表明,在半天内会有主要的金融和运营影响,RTO不能超过四个小时。

指定的角色

许多灾难恢复计划的另一个关键组成部分是开发明确的决策层次结构。灾难恢复计划团队的每个成员都有一个具体的责任,如果发生灾难,备份人员将弥补所有需求。通过分配角色,公司可以帮助防止混淆,并确保人们不必怀疑谁负责在实际紧急情况下执行计划的各种部分。

临时计划

并非每场灾难都会对业务系统和数据保护过程产生相同的影响。出于这个原因,重要的是包括可能发生的各种事件的不同程序 - 是否是它是一个全局大流行或日常威胁,如断电和电火灾。

正式审查过程

为了使灾难恢复计划有效,应该将其作为一个持续的过程进行处理—其中包括定期测试。如果不定期测试该计划,可能会让公司面临过时的政策和程序的风险,这些政策和程序不再与当前的业务相关,或者在灾难发生时无法按要求执行。例如,主要的软件更新是更新计划的原因之一,新供应商也是如此。作为一个最佳实践,灾难恢复团队应该创建一个定期检查、测试和更新的时间表。

灾难恢复如何补充业务连续性计划?

灾难恢复是一个关键组成部分业务连续性规划。后者侧重于在发生意外破坏的情况下保持业务运营的所有方面,并涵盖了一系列变量:员工将工作,他们将如何安全,谁负责通信和更多。在连续性的核心中,需要提供不间断的技术访问,因此员工被赋权以通常继续业务。出于这个原因,灾难恢复是业务连续性的基础。

灾难恢复的最佳实践是什么?

准备灾难恢复时,专家建议牢记一些关键最佳做法:

提前准备好团队

当灾害发生时,评估时间很少。在最极端的情况下,业务运营可能会完全停止,需要重建或重新返回。出于这个原因,必须提前准备人们,所以他们知道要期待什么,可以相应地行事。至少,员工应该知道在哪里保持安全,一旦开始重新连接,如何访问系统以及优先考虑的内容。

充分利用基于云的解决方案

虽然传统的灾难恢复允许公司恢复内部基础设施,但一种更快、更灵活的方法是建立云灾难恢复计划。这种方法减轻了IT部门对复杂临时需求的需求,例如交付新设备或维护临时软件,直到恢复正常操作。将云存储和基于云计算技术到位有助于确保员工在任何设备上遇到灾难罢工后可以继续工作。额外的福利包括降低成本,少于房地数据中心依赖,快速部署和易于进行常规灾难恢复测试。云灾难恢复组件的示例范围从虚拟化解决方案,例如托管桌面,到基于云的工具,例如文件同步与共享内容协作

致力于长期的灾难恢复解决方案

重要的是要记住,有效的IT灾难恢复不是一次性灾难恢复计划会话的结果,而是涉及长期承诺。预期的RPO和RTO可以随着业务规模和增长而变化,因为公司可能需要所需的灾难恢复服务类型,这些类型是否应该扩展到新地理位置。常规评论,正在进行的测试和频繁更新都是所有密钥。

额外资源