【3分で読める】SAP・JP1・HULFTを止めない為の障害対策

    はじめに

    みなさんこんにちは。プリセールスの西下(にしした)です。
    今回は代表的な「基幹系システム」として挙げられるSAP・JP1・HULFTに求められるシステム障害対策についてお話させていただきます。

    この記事を読めば、止められない基幹系システムを安定運用する為の注意点や、実現する為のソリューションについて知っていただけます。

    システム障害のリスクと対策のコストバランス

    業務の根幹をなす基幹系システムには、十分な障害対策が必要で、業務規模の関係上一度障害が起こると大きな損害が出るケースも少なくありません。

    しかしながら、いつ起こるかわからない障害に、常に人間が付きっきりで監視し続けるのも、コスト的には無駄が多いと言えます。以下は投資額とサービス再開までにかかる時間の関係です。

     

    投資額とサービス再開までにかかる時間

     

    障害対策要件を検討する際、システムが再稼働するまでの時間であるRTO(目標復旧時間)とデータを戻す時点であるRPO(目標復旧時点)を考慮します。

    各ポイントを障害直前・直後に近づければ近づけるほど、障害が及ぼす業務への影響を小さくすることができますが、逆に投資額は大きくなります。したがって、システムごとにその復旧要件と、かけられるコストのバランスをとることが大切です。

     

    では、実際に障害が起こった時の損害はどれ位の規模になるのでしょうか?
    これはシステムの重要度に依存しますが、検索でもヒットするECサイトの障害であれば1分止めれば数千万円規模の損害が出ている事案が多くあります*。ここまではいかなくても、基幹系システムであれば比較的近いレベルの損害が想定されます。
    (*一例:
    https://www.wwdjapan.com/428626

    仮に障害に運用担当者が気付いたとしても、マニュアルを確認しながらプレッシャーの中での復旧作業は時間がかかりますし、更にミスによる障害の温床になります。このため基幹系システムは、多少コストを掛けてでも迅速な復旧が求められます。また、一昔前までは障害原因と言えばハードウェアでしたが、ハードウェアの信頼性が高まった近年では、ソフトウェア起因の障害がハードウェアを逆転しているという統計も出ています。

     

    障害原因

    そこで投資額と障害復旧までの時間のバランスの取れたHAクラスターをお勧めします。HAクラスターはフォールトトレラントにはRPOやRTOの観点では及びませんが、予算も合わせて考えるのであれば最もバランスの取れた選択肢と言えます。また、ソフトウェアの障害も検知できる点も大きいです。

    システム別 障害への対応表

    なおバックアップはRPOやRTOの観点では他の方法よりも遅いですが、過去の特定時点の状態を履歴で管理していつでも特定時点に戻せる特性も持っているため、他の方法と併用されることが望ましいといえます。

    「クラウド移行後はベンダーに任せれば安心」は間違い

    最近の傾向として、オンプレからクラウドへの移行が多数派になりつつあります。但しここでも注意が必要です。

    >>SAPのクラウド移行と障害への対策
    >>SAPもクラウドに移行する時代が本格到来。移行で注意すべきことは?BeeXインタビュー前編

    お客様と日々お話をさせていただく中でとても多いのが、クラウドへ移行すれば後はクラウドベンダーが全ての動作を保証してくれると誤解をされているケースが多くありますがこれは正しくありません。

    >>クラウドの高可用性と災害復旧について、5つの神話を覆す
    >>クラウドと可用性(1) – クラウド環境の可用性を信じていいのか?

    移行先に自由度の高いIaaS(Infrastructure as a Service)選んだ場合、クラウドベンダーが可用性(サービス提供が出来なくなる事態の発生頻度が少ないこと)を担保してくれるのは基盤側(青色の層)のみなので、OSより上位の層はノーガード状態になるため、別途対策が必要になります。

    責任範囲図

    当社の高可用性ソリューションはここがスゴイ!

    当社の高可用性ソリューションは、このオレンジの層の障害を自動的に検知して復旧します。

    日本国内ではWindowsのお客様が大変多く、当社ソリューションの導入実績も多くあります。Windowsの場合は、Windows Server標準機能(WSFC:Windows Server Failover Clustering)を使うため、必要となる当社製品はDataKeeper(DataKeeper for Windows Cluster Edition)のみとなり、圧倒的な低コストで高可用性構成が実現します。詳しくはこちら

    <概念図(クラウド上でWindows環境の場合)>

    概念図_Windows

     

    <概念図(クラウド上でLinux環境の場合)>

    概念図_Linux

     

    簡単に当社高可用性ソリューションの構成要素について補足します。

    高可用性ソリューション構成要素

    当社の高可用性ソリューションの主な特長です。

    グローバルで25年、8万ライセンス以上の導入実績


    各ソフトメーカーの認定製品(SAP、日立製作所、セゾン情報システムズなど)
      
    >>詳しくはこちら

    ・安心の自社開発製品

    クラウド上で導入実績多数

    ・障害でシステムを止めることと比較した場合、HAクラスター構成に必要なライセンスはとても安い

    ・スクリプトを書かずに誰でも容易に構築できるスタイル
    (※市場の一般的な製品と同じようにスクリプトを書く構築も可能)

    ・商用ソフトウェアならではの手厚い国内サポート
      
    >>詳しくはこちら

    ・シンプルな操作性なので運用への引き継ぎがスムーズ

     

    これらの製品に関するお問い合わせも顕著に伸びており、既に多数の実績が出ております。  
     >>導入事例

    >>SAPとLifeKeeperの連携ソリューションはこちら
    関連資料:SAP向け高可用性ソリューション

     

    >>JP1とLifeKeeperの連携ソリューションはこちら
    関連資料:日立統合システム運用管理JP1のクラスター構成ガイド

    JP1をLifeKeeperで冗長化するための評価キットはこちらからダウンロードできます
    ※リンク先は日立製作所様のサイトです

    >>HULFTとLifeKeeperの連携ソリューションはこちら
    関連資料:LifeKeeper for Linux HULFT Recovery Kit 管理ガイド

    まとめ

    加速する基幹系システムのクラウドへの移行の際には、移行先でも障害対策は必要です(もちろんオンプレへの移行でも必要です)。クラウドは利用者が意識しなければ、障害対策は十分とは言えません。

    多くの実績のある当社ソリューションもっと詳しく知ってみませんか?

    「詳しい話を聞いてみたい。」「具体的な構築手順書は無いか?」「この案件は対応できそうか?」など、下記までお気軽にお問い合わせください。

    次回はSAP向けの高可用性ソリューションについてわかりやすくご紹介致します。お楽しみに!