近年では、運用監視環境をクラウドでクラスタ化することで可用性を高めたいというニーズが高まっています。システムを安定運用するには、それらを下支えする運用監視環境が必要です。
本記事では、ある企業で監視環境の冗長化を実現した方法について、日立ソリューションズ様にインタビューを実施した内容を紹介します。
JP1をクラウドでクラスタ化した高品質な運用監視環境を望む企業の声
統合運用管理ソフトウェアとして多くの現場で採用されているJP1は、市場のニーズに応じて製品ラインアップを拡大し続けています。JP1 Version 12では、「Intelligence」「Intelligent Monitoring」「Intelligent Automation」「Intelligent Governance」の4つの分野で製品を展開。JP1シリーズの中でも代表的なのが、業務を自動化するジョブ管理ソフトウェア「JP1/Automatic Job Management System 3」(以下、JP1/AJS3)です。複数のクラウドサービスやオンプレミスで行う業務の実行を制御し、大規模で複雑なシステムで行う業務全体の自動化による効率化と安定稼働を支援します。
さらに、パフォーマンス管理ソフトウェア「JP1/Performance Management」(以下、JP1/PFM)と統合管理ソフトウェアの「JP1/Integrated Management 2」(以下、JP1/IM2)のニーズも高まっています。JP1/PFMはOSやデータベース、アプリケーション、仮想化環境などの稼働情報を収集して一元的に確認するもので、アラーム監視とレポート監視の2つの機能を持つソフトウェアです。
JP1シリーズは製品間の連携に優れていて、JP1/AJS3、JP1/IM2、JP1/PFMを組み合わせることでJP1/AJS3のジョブで障害が発生した際に、JP1/IM2で障害を検知、関連するサーバや後続ジョブを特定して、JP1/PFMでその先のサーバの性能情報を確認するといったスムーズで迅速な対応を支援します。
近年は、安定稼働が求められるシステムを監視するJP1をクラスタ化し、より厳重に監視したいとのニーズが高まっています。
日立ソリューションズの瀧森理一郎氏(スマートライフソリューション事業部 スマートワークソリューション本部 インフォメーションシェアリングソリューション部 第1グループ LifeKeeperビジネス担当)は、サイオステクノロジーからのインタビューで、顧客のニーズを次のように語ってくださいました。
「ミッションクリティカルなシステムをオンプレミスで運用してきたお客さまから、システムだけでなく監視環境もクラスタ化してして高可用性を実現したいとのお声を頂くことがあります。クラウドシフトに伴って、クラウド環境におけるJP1のクラスタ化のニーズが高まっています」
JP1のクラスタ化で「LifeKeeper」を選んだ4つの理由
このニーズに対して、日立ソリューションズ様にはサイオステクノロジーのHAクラスタソフトウェア「LifeKeeper」を提案していただいています。
LifeKeeperは、グローバルで約8万ライセンスを販売するなど豊富な実績を持ち、直感的なGUIで運用を簡素化できるのが特長。JP1など主要ソフトウェアのクラスタ化を支援する機能「Application Recovery Kits」(ARK)を備え、わずかな工数で信頼性の高いクラスタを構築可能です。
日立ソリューションズ様は、ある顧客企業の依頼でLifeKeeperを使ってJP1のHAクラスタ環境をパブリッククラウドに構築したといいます。その顧客は、プライベートクラウドで運用してきたシステムをAWSに移行。安定稼働が求められるミッションクリティカルシステムであることから、JP1/AJS3とJP1/PFM、JP1/IM2 もクラスタで冗長化したいというニーズがありました。その顧客企業にLifeKeeperが選ばれた理由は以下の4つです。
- HAの実現が容易
LifeKeeperにはJP1/AJS3やOracleなどの主要なソフトウェアをクラスタ化するための専用スクリプトがオプションで用意されています。
スクリプトを一から作らなくていいので、HAクラスタを短期間で構築可能です。 - データ共有の仕組み
クラスタを動作させるには、ノード間でデータを共有する必要があります。
AWSでは共有ディスクが利用できませんが、サイオステクノロジーのデータレプリケーション製品である「DataKeeper」を用いることでデータ共有を実現できます。
- 多様な接続方法への対応
クライアントとAWS間を接続する方法は複数ありますが、当初の段階ではどの方法を使うかが定まっていませんでした。
そんななか、広範な接続方法に対応していることが、LifeKeeperが選ばれる理由の一つになりました。
- 盤石なサポート体制
日立ソリューションズ様は、サイオステクノロジーと緊密な協業体制を敷いています。
問題の発生時も、JP1の開発元である日立製作所と連携した手厚いサポートを受けられます。
最大のボトルネックとなったJP1/PFMとJP1/IM2のクラスタ化用スクリプトを独自開発
プロジェクトの中で特に時間を要したのが、JP1/PFMとJP1/IM2をLifeKeeperでクラスタ化するスクリプトの作成でした。
「JP1/AJS3はサイオステクノロジーが提供するARKを購入することで簡単にクラスタを構成できますが、JP1/PFM/JP1/IM2用のスクリプトは用意されていません。JP1/PFM/JP1/IM2のクラスタの起動と停止と再起動、そしてサービス起動中に正常動作チェックをするスクリプトを独自に開発する必要がありました。クラスタ化対象である統合管理マネージャー『JP1/IM2 – Manager』、稼働監視マネージャー『JP1/PFM – Manager』、稼働監視コンソールサーバ『JP1/PFM – Web Console』とOS稼働監視エージェント『JP1/PFM – Agent Option for Platform』用にそれぞれ4本のスクリプトを作成しました」(瀧森氏)
スクリプトの開発は、日立ソリューションズのJP1連携ソリューションチーム(DX運用管理ソリューション部)と同社内の長年JP1を取り扱ってきた部署が緊密に連携して進めました。JP1/PFM/JP1/IM2の制御コマンドや動作チェック時の判断要件などを入念にヒアリングして設計し、ロジックに落とし込む作業を重ねることで、要件を満たしていきました。
「今回はJP1の稼働OSとして『Windows Server』を利用し、スクリプトは『Microsoft Visual Basic Scripting Edition』で開発しました。作成したスクリプトを入念にテストして、『障害が発生したら10分以内に自動で切り替える』というお客さまの要件を満たすことを確認しました」(瀧森氏)
構築したJP1クラスタの構成は下図
HAクラスタ環境は「Amazon Elastic Compute Cloud」(Amazon EC2)に構築。「AWS Transit Gateway」を介したルートテーブルによる制御を採用し、2つのアベイラビリティーゾーン(AZ)で稼働系と待機系のJP1を稼働させました。AZ間のデータ共有はDataKeeperによるディスクミラーリングで実現。図下部の「Amazon Simple Storage Service」(Amazon S3)には、スプリットブレインの発生を防止する「Quorum/Witness Server Kit」を配置しました。
HAクラスタの設計からAWSの環境構築、スクリプト作成とテスト、JP1の導入までの一連の工程を約2カ月で完了し、無事に本番稼働させることができました。特にトラブルもなくシステムの安定稼働を支えています。
「JP1×LifeKeeper」で信頼性の高い監視環境を実現
今回のプロジェクトでは、ARKがサポートしていないJP1/PFMとJP1/IM2用のスクリプトを独自開発することでLifeKeeperによるクラスタ化を実現しました。別の顧客企業からはネットワーク管理ソフトウェア「JP1/Network Node Manager i」「JP1/SNMP System Observer」をクラウド環境でクラスタ化したいとのニーズが寄せられています。
「多くのお客さまがミッションクリティカルシステムのクラウドシフトを検討されています。昨今のクラウドシフトの潮流を鑑みると、クラウド環境における監視環境のクラスタ化ニーズは一層高まっていくことでしょう。今回の事例で得たノウハウを生かし、より多くのお客さまにLifeKeeperを用いたJP1のクラスタ化をご提案したいですね」(瀧森氏)
JP1は、クラウド環境においてもシステムのオブザーバビリティー(可観測性)を高めるための機能拡張を進めている他、AIを活用して運用監視の高度化を図るなど、複雑化するシステムの運用監視支援機能を拡充する考えを持っているといいます。
瀧森氏は最後に、日立ソリューションズ様の今後の意向を次のように語って締めています。
「今後もLifeKeeperとJP1との連携に関する技術の研さんやノウハウの蓄積を進め、ミッションクリティカルなシステムのクラウドシフトを進める企業を支援します。LifeKeeperを用いたJP1のクラスタ化を検討される際は、ぜひ当社にご相談ください。当社は日立グループとしてJP1に関する豊富なナレッジを強みとしており、品質の高いHAシステムを設計からサポートまでオールインワンでご提供致します」
LifeKeeper×DataKeeperでクラウド環境でもシステム安定稼働
本記事で挙げた企業のように、「システムをどう安定稼働させるか」という課題を持つ企業は少なくありません。特に、基幹系システムをクラウドに移行する場合は、制約も多く慎重になります。
サイオステクノロジーの「LifeKeeper」は、クラウド環境でも多く実績があるソフトウェアです。そのうえ、「Application Recovery Kits」(ARK)や「Quick Service Protection」(QSP)を用いれば、より容易に構築できます。
加えて、共有ストレージが利用できない場合が多いクラウド環境では、データ共有も課題になります。データレプリケーション製品の「DataKeeper」は、論理的な共有ディスクを提供するため、データの整合性も担保します。「LifeKeeper」と併用することで、クラウド環境でも堅牢なシステムを構築可能です。
システムのクラウド移行や可用性に関するお悩みがある方は、ぜひお問合せください。