クラウドにおけるリスクと対策

AWS環境の可用性の現実と解決策について

image1

みなさんこんにちは。東日本担当のプリセールスの西下(にしした)です。
(「西の國政(くにまさ)・東の西下」と覚えてくださいね。)
近頃日が落ちるのも早くなり、寒さも真冬っぽくなってきましたね。皆様もどうぞ体調にご留意下さいませ。

さて、当ブログではこれまで「クラウド環境の可用性(=システムの継続稼動能力)の現実」「なぜクラウド環境でHAクラスターが必要なのか?」といった記事を複数公開してきました。
>>クラウドと可用性 – クラウド環境の可用性を信じていいのか?

当社では長年クラウドの可用性に取り組んでおり、お陰様で多くのお客様に当社のHAソリューションが認知され、数多くのクラウド案件の導入実績があります。
>>導入事例

今回はクラウド案件の中でも人気をAzureと二分するAWSに焦点を当てて、2回に分けてお話させていただきます。

続きを読む

クラウドと可用性(4) – クラウドに潜むSPOFの罠とは?

multi-region-ha-clustering

>>第1回から読む

HAクラスターを構成するには、特定の部分に障害が発生した際にシステム全体が停止してしまう要素となるSPOF(単一障害点:Single Point of Failure)を避けることが大原則です。しかし、パブリッククラウドでは運用基盤が見えづらいだけに注意が必要です。稼働系ノードと同じホストサーバー、同じラック、同じネットワークスイッチの配下で待機系ノードを配置されてしまう可能性があり、それにより冗長化されていない要素ができると、いざという事態の可用性を担保することができません。データセンターや運用基盤を物理的に完全に分離した「リージョン」や「アベイラビリティゾーン」を利用する必要があります。

続きを読む

クラウドと可用性(3) – クラウド上の障害発生/復旧は結果オーライでいいのか?

function-of-management-tool

>>第1回から読む

システムに障害が発生した際に、HAクラスター構成の待機系ノードでのフェールオーバーがスムーズに行われ、問題なく業務が継続できたとしても「結果オーライ」では済まされません。システムのどの箇所にどんな障害が発生し、どのようにフェールオーバーしたのか。障害の原因と復旧のプロセスをしっかり検証し、システムに内在する問題点があれば改善する必要があります。クラウド上にHAクラスター構成を導入し、適切に運用していくための勘所を紹介します。

続きを読む

クラウドと可用性(2) – WSFCはクラウドに移行できない?

WSFC機能を利用した標準クラスタリング構成

>>第1回から読む

多くの企業が、Windows Server標準のフェールオーバクラスタリング機能(WSFC)を使って重要なシステムの可用性を担保しています。しかし、このインフラをそのままクラウドに持っていくことはできません。WSFCでは稼働系と待機系をまたいだ共有ストレージが必須となりますが、一般的なクラウドサービスのIaaS (Infrastructure as a Service)では共有ストレージを利用することができないからです。

続きを読む