【海外事例】止められない支払いシステム。WSFCとのシームレスな組み合わせでAWS上のSQL Serverを冗長化。

    サイオステクノロジー海外拠点の事例のご紹介です。
    DataKeeperとWSFCを組み合わせて、AWS上にてSQL Serverを冗長化いたしました。
    米国最大のエネルギー企業の前払いプログラムを管理する、支払いソリューションプロバイダー「PayGo」が持っていた課題、環境、導入した結果をご紹介します。

    信頼できるオペレーション、高い性能、使いやすさでSIOSを選択

    PayGo (www.paygoutilities.com) は、米国最大のエネルギー企業の前払いプログラムを管理する、非上場の統合型ユーティリティ支払いソリューションプロバイダーです。
    同社は、Southern Company、Duke Energy、Consumers Energy、NV Energy、Exelon、Amerenなどの米国最大のエネルギー企業の前払いプログラムを管理しています。
    ジョージア州アルファレッタに本社を置くPayGoのPay-as-You-Goユーティリティプログラムは、2,500万人以上のエネルギー顧客にサービスを提供しています。
    同社の現金支払いソリューションであるCheckOut by PayGoを使用すれば、顧客はサービス窓口に行かずにいつもの小売店のレジで支払いを済ませることができます。
    PayGoのソリューションは顧客の満足度を高めるだけでなく、公共事業会社のコスト削減にも貢献しています。
    そしてPayGoがコストを削減するためには、プラットフォームをクラウドで運用することが不可欠です。

    環境

    PayGoは、すべての本番システムをAmazon Web Services(AWS)にデプロイしています。
    同社の環境は、ソリッドステートドライブ(SSD)のみのストレージを搭載したElastic Compute Cloud(EC2)仮想サーバーを利用して、ディスクのスループットパフォーマンスを最大化しています。

    現在、AWSに4つの本番環境があり、近日中にもう1つの本番環境がオンライン化される予定です。
    PayGoは、データベースのバックエンドにWindows Server 2012 R2上で動作するSQL Server 2017 Standard Editionを使用しており、テスト完了後にWindows Server 2019への移行を計画しています。

    課題

    インフラストラクチャおよびセキュリティ担当シニアディレクター、チャド・ゲイツ氏は次のように説明しています。
    「当社のバックエンドSQLサーバーにはテラバイト級のデータが保存されており、これは24時間365日利用可能である必要があります。Windowsユーザーとしては、データを保護し、障害発生時にも継続運用できるようにするために、Windows Server Failover Clustering(WFSC)を利用したいと考えています。
    しかし、WSFCにはストレージエリアネットワーク(SAN)などの何らかの形の共有ストレージが必要ですが、これはAWSではネイティブに利用できません。」

    AWSには共有ストレージがないため、PayGoはSQL Serverのトランザクションログとログ配布を使用してデータを保護する必要がありました。
    手動による介入が必要ですが、このアプローチは災害復旧(DR)の目的では許容できました。
    しかし、同社のミッションクリティカルなアプリケーションの高可用性(HA)を確保するために必要な、迅速な自動フェールオーバー機能を提供することはできませんでした。

    「別の選択肢もありましたが、もっと費用対効果の高いソリューションがあると信じていました」と、ゲイツ氏は言います。

    「SQL Server Enterprise EditionのAlways On可用性グループ機能を使用することもできましたが、それには数十万ドルの費用がかかり、その費用があれば他のミッションクリティカルな取り組みを実施することもできました。
    私たちはもっと良いソリューションがあるはずだと思ったので、他の選択肢を探し始めました。」

    評価

    高性能で費用対効果の高いHAソリューションを探す中で、PayGoは次の4つの基準を設定しました。

    • Windows Server Failover Clusteringとシームレスに統合できる。
    • 復旧ポイントと復旧時間の目標を満たす高いディスクスループットパフォーマンスを提供する。
    • 導入が簡単で、信頼性の高い継続的な運用ができる。
    • ベンダーからの迅速な技術サポートが得られる。

    さまざまな選択肢を調べている間に、ゲイツ氏は同僚からSIOSテクノロジーの製品を見てみるよう勧められ、彼はSIOSの製品が気に入りました。

    「SIOS DataKeeper Cluster Editionは、共有ストレージを使用できないことによって引き起こされる問題を解決できました。
    ミラードライブの使用は、WSFCにとって共有ストレージのように見えます。まさに私たちが求めていたものでした。」

    またSIOS DataKeeperは、検討していた他のどのソリューションよりも、PayGoのその他の3つの基準を満たしていました。

    ソリューション

    SIOS DataKeeperは、WSFCとのシームレスな統合に必要な、高性能かつリアルタイムのブロックレベルのデータレプリケーションを提供します。
    これにより、SQL Server Standard Editionのフェールオーバー クラスター インスタンス(FCI)もサポートできるようになります。
    SANlessクラスターは、SQL Serverにアプリケーションレベルでの障害対応のための継続的な監視、自動フェールオーバーやフェールバックに必要なディスクパフォーマンスを提供します。
    PayGoはまず自社のプライベートクラウドにSIOS DataKeeperソフトウェアをインストールし、その後構成をAWSに移行しました。

    「SIOS DataKeeperはプライベートクラウド、パブリッククラウド、ハイブリッドクラウド環境をサポートしているため、すべてのアプリケーションソフトウェアとデータを含む構成全体を、問題なく簡単に移行することができました」と、ゲイツ氏は振り返ります。

    PayGoは現在、4つのSANless HAクラスターのそれぞれに2つのSQL Serverノードを配置しています。
    ローカルの障害に対する保護を提供するために、サーバーは別々のアベイラビリティーゾーンに配置されています。
    また、高いトランザクションスループット性能を確保するために、各サーバーに2つのネットワークインターフェースを設定し、1つをSIOSのデータレプリケーション専用にしています。

    SANlessクラスターは、AWSがアベイラビリティーゾーン間で提供する、サブミリ秒(ms)のレイテンシの接続を介した同期データレプリケーションを採用しています。
    PayGoのITチームは現在、別のAWSリージョンに3番目のノードをデプロイすることにより、HAクラスターにDR保護を追加することを検討しています。
    この場合の距離(バージニア州とオハイオ州のデータセンター間)では、12〜13ミリ秒のレイテンシが発生します。
    アクティブノードで高いスループットパフォーマンスを確保するには非同期レプリケーションが必要ですが、統合HA/DRソリューションでは、ログ配布を使用した場合よりもはるかに速く回復できます。

    結果

    SIOS DataKeeperは、インストールや操作の容易さ、迅速なサポートなど、高可用性ソリューションに対するPayGoの高い期待に応えたどころか、期待を上回るものでした。
    ゲイツ氏は次のように述べています。
    「SIOS DataKeeperは数年前から使用していますが、これまでに使用してきたソフトウェアの中で最も強固なものであることがわかりました。本当にうまく機能していて、それを当たり前のことのように考えてしまっているほどです。」


    アプリケーションはミッションクリティカルなものであるため、PayGoは何も当たり前のこととは考えていません。
    実際に障害が発生した場合も含めて、その実績のある運用により、ITチームは本番環境のSANlessクラスターの継続的なテストを最小限に抑えることができています。
    現在クラスターのテストは、ハードウェアまたはソフトウェアのいずれかに変更が加えられた後にのみ月次でスケジュールされ、テスト自体は簡単なフェールオーバーとフェールバックで構成されています。
    PayGoはまた、必要に応じて各クラスターで一度に1ノードのみをアップグレードすることにより、ロールバックを簡略化しています。

    SIOS DataKeeperのパフォーマンスが非常に高いので、Standard Editionのデータベースサイズの制限を超えてしまうという点以外、PayGoがSQL Server Enterprise Editionにアップグレードしなければならない理由はなくなりました。
    これは成長中の企業にとっては大きなメリットだと言えるでしょう。