※この記事は翻訳されたものです。本記事の原文はこちら
ディザスターリカバリー(DR)という言葉をよく耳にすると思います。ディザスターリカバリ / Disaster Recovery (DR)とは、人災や自然災害が発生した際に、重要なITシステム、データベース、アプリケーションが継続して稼働し、ユーザーが利用できるようにするための戦略や一連のポリシー、手順、ツールのことです。
一般にDRでは、アプリケーションの運用を、プライマリー環境から地理的に離れ、冗長化されたDR環境に移行します。DR戦略はITチームが担当しますが、DRはすべての組織の事業継続計画の重要な構成要素です。事業継続計画とは、サービスが中断しても事業を継続できるようにするための一連の戦略と方針、手順、ツールのことを言います。
最初はわかりづらいと思いますので、DRを簡単に理解するために、以下のようにまとめてみました。
ディザスターリカバリー(DR)を理解する6つのポイント
1.ITディザスターリカバリーまたは災害復旧計画(DRP)を策定する。
災害復旧計画(Disaster Recovery Plan:DRP)とは、組織の主要なコンピューティング環境が災害に見舞われた際に、重要なITシステム、データベース、アプリケーションが継続して稼働し、ユーザーが利用できるようにするための戦略および一連のポリシー、手順、ツールのことです。DR戦略はITチームが担当しますが、DRはすべての組織の事業継続計画の重要な要素です。
2.確実に地理的に分離する。
アプリケーションのディザスターリカバリーに不可欠なのは、地理的に分離された冗長なアプリケーション環境を利用できるようにすることと、災害時に操作をフェールオーバーできる効率的なブロックレベルのレプリケーションまたはクラスタリングソフトウェアを用意することです。アプリケーションがクラウドで実行されている場合、クラスタリング環境はDR対応として、クラウドのリージョンや可用性ゾーンをまたいでフェールオーバーできなければなりません。
3.テスト、テスト、そしてさらにテスト。
最近のSpiceworksの調査では、1年間に1~3回の停止(通常レベルのIT関連サービスの中断)を経験したことがあると答えた企業は59%、4~6回が11%、7回以上が7%でした。つまり、DRイベントはほぼ避けられないということです。そのため、定期的にテストを行い、何が起こるのかを正確に把握しておく必要があります。
4.リスクを理解する。
DRの対象となる災害は、必ずしもハリケーン、竜巻、洪水、地震など、ビジネスに影響を与える大規模なものとは限りません。災害には、サイバー攻撃、火災、盗難、破壊行為など、さまざまな形があります。実際、ITデータセンターのダウンタイムの原因としては、いまだに単純なヒューマンエラーが上位を占めています。つまり、災害とは、ITインフラ、データセンター、そしてビジネスに影響を与える、長期間のシステムダウンや大規模なデータ損失をもたらす危機のことを指します。
5.チェックリストを用意する。
DRPには、重要なITシステムとネットワークを目標復旧時間(RTO)で優先順位付けしたチェックリストを含むようにします。また、システムやネットワークの再起動、再設定、復旧に必要な手順を文書化してください。従業員は、不測の事態が発生した場合に、DRPがどこにあるのか、また基本的な緊急時の手順をどのように実行するのかを知っておく必要があります。
6.テストによりDRPを実証する。
これにより、欠陥を特定し、災害が発生する前に問題を修正する機会が得られます。テストを行うことで、計画が効果的で、目標復旧時点と目標復旧時間(RPOとRTO)を満たすことができるかどうかを確認できます。ITシステムやテクノロジーは絶えず変化しているため、DRテストは災害復旧計画を最新のものにするためにも役立ちます。
さいごに
アプリケーション操作のDRノードへの高速かつシンプルで信頼性の高いスイッチオーバーを実現し、簡単なDRテストが行えるようなフェールオーバークラスタリングテクノロジーを選びましょう。
上記のようなデータを見ると、災害復旧計画を導入していない場合は、奇跡的に生きのびているだけだということがわかります。サイオスが他の多くのDRプロバイダーとは一味違うのは、高可用性とディザスターリカバリー(DR)の両方のニーズを満たす1つのソリューションを提供している点です。DataKeeperを中心に構成されたSIOSのDRソリューションは、RPOおよびRTOに簡単に対応できる、地理的に分散したマルチサイトのクラスターです。
SIOSのDRソリューションの詳細については、こちらをご覧ください。