ハイブリッド クラウド環境を監視、管理するには?

 2018.01.26  ストレージチャンネル編集部

多くの企業がITシステム基盤にクラウドを活用しています。企業によってはプライベートクラウド環境から複数のパブリッククラウド環境、そして、それらを上手に組み合わせたハイブリッドクラウド環境で企業情報システムの運営を行なっていることでしょう。

情報システム部門は、このような複数環境に分断された環境で、ひとたび問題が起きると大きな損害へと発展することを恐れていることでしょう。

そして、多くの情報システム部門は大きな問題へと発展しかねないボトルネックを早期に認識する必要があると考えるのが普通です。

しかし、肥大化・複雑化したインフラ環境から問題を探し出すことは「藁の中の針を見つけるような」作業と同じです。

これらの問題を解決するのが「インフラ分析ソリューション」です。インフラ分析ソリューションを導入すれば従来型のアプローチに比べて90%も早く問題を特定することが可能になります。

今回はそのインフラ分析ソリューションに関してご紹介します。

ハイブリッドクラウドの躍進とインフラ分析を行わない怖さ

インフラ分析ソリューションがどのように働くのかを説明する前に、インフラ分析を行わないままだったらどうなるのか、そしてなぜ情報システム部門のパフォーマンスに関するトラブルシューティングが従来のアプローチでは駄目なのかをご紹介しておきましょう。

今や企業はたくさんの選択肢を持っており、企業のオンラインシステムで問題を経験した瞬間に競合他社へと移ってしまうでしょう。このような状況では企業はビジネスを失いブランドが傷つけられるという結果へと直結します。

このような問題は、アプリケーションの停止かもしれませんし、レイテンシーの急上昇かもしれません。何れにしても顧客満足は損なわれることになります。

しかし、その一方で企業の情報システム環境は今まで以上に複雑なものになっています。多くの企業は過去のシステムをモダナイズしていかなくてはなりません。そして何より重要なことは素早い行動です。オンプレミス環境では常にアップデートが必要であり、市場ニーズに瞬時に対応可能なプラットフォームの革新を行うためにはクラウドサービスの導入は必須と言えるでしょう。このことは企業の情報システム基盤が、マルチサイトでのハイブリッドクラウド環境としてしっかりと運用管理されなければならないということに繋がるのです。

このような複雑さに加え、問題を見つけるのはまるで「藁の中の針」をみつけるようなものです。

ストレージに関するお役立ち資料

企業が「なぜアプリケーションが急停止したのか」を探している間にも、顧客は不満を抱えて離れて行くでしょう。

このような状況を避けるために企業はインフラ分析ソリューションが必要なのです。このインフラ分析ソリューションは、情報システム基盤における異常を検知して、今まで何時間あるいは何日もかかって辿り着いた問題を数分で特定します。また、インフラ分析は緊急事態になる前に問題を解決することが可能になるのです。

[SMART_CONTENT]

インフラ分析ソリューションとは?

インフラ分析ソリューションは、非常にシンプルでありながら強力なソリューションです。ここでは具体的にインフラ分析ソリューションが、どのように動作するのかを確認してみましょう。

1. なにを所有していてそれがどう働くのかを認知

NetApp® OnCommand® Insight (OCI)のようなインフラ分析ソリューションは、マルチクラウドやマルチベンダーにまたがる全ての情報システム基盤についてのデータを収集します。

このデータにより、パフォーマンス属性と共に、システム構成、アプリケーション、仮想マシン、ネットワーク、ストレージについて詳細に理解できるようになります。この情報のすべては、常にアップデートされ、新たな知見のために分析されるデータウェアハウスの中に収められます。例えば、過去のデータに基づいて何が正常で、何が予想された行動の範囲を逸脱しているのかを示すパターンが分析により明らかになります。

2. 異常を検知

従来型の問題検出の方法では閾(しきい)値を設定します。そしてこの閾値を超えたら警告(アラート)を発する仕組みで動作します。

この方法には次のような大きな問題があります。実際には問題ではなく正常な行動についてまでたくさんのアラートを発してしまうのです。

そのため、多くの管理者は誤ったアラートを減らすために閾値を緩めていきます。その結果、実際に問題が起こったことを知らせるアラートを見逃してしまうのです。

このような事態を避けるためにインフラ全体にまたがる運用パターンとビジネスルールを結び付けることで、インフラ分析と機械学習により必要なアラートだけを発することができるようになります。

3. 問題をピンポイントで指摘

異常な行動についての通知を受けた後、どうしますか?

次のステップは根本的な原因を見つけることです。

インフラ分析ソリューションを導入していない場合、問題の根本原因を特定するために複数の分散した環境でそれぞれの管理ツールを用いる必要があります。これらの作業は煩雑であることは言うまでもありません。

インフラ分析ソリューションを導入していれば、ウェアハウスに集めたデータに対して相関エンジンを用いて根本原因を簡単に特定することが可能になります。どの要因が互いに高い相関関係にあるのかを知っているので、どこを探すべきかすぐに教えられるのです。インフラ分析ソリューションこそが藁の中で針を見つける方法と言えるのでしょう。

[RELATED_POSTS]

インフラ分析ソリューションのデモ

どれほど簡単かをご理解いただくためのデモをご用意しました。ぜひこの機会にNetApp OnCommand Insightをご確認ください。

インフラ分析で成功した企業事例

インフラ分析は問題がビジネスに影響を与える前に解決をお手伝いします。具体的な例としてCerner社の事例を確認します。

同社は115ペタバイト、ディスクアレイ400、仮想マシン60,000台という巨大IT環境を有しています。

そのような大きく複雑なマルチサイト環境における監視では、CernerのチームにはSLA(サービスレベル)を満たすためのツールが必要でした。

そのため、ビジネスに衝撃を与える前に問題を特定回避できるように、同社ではNetApp OnCommand Insightで備えた予測機械学習を使用したのです。NetApp OnCommand InsightはCernerに異種環境にまたがる仮想/物理ホストからスイッチ、ストレージまでの包括的な可視性を提供しました。

NetApp OnCommand Insightを使うことで、Cernerのチームは問題が起きてから反応するリアクティブから先を見越して事前に対応するプロアクティブへ、そして今ではたった一つの根本原因ダッシュボードを使って予測される問題の回避まで行えるようになったのです。

彼らはMTTR (平均修復時間) とトラブルシューティングを大幅に削減することに成功しました。

Cernerの事例についてもっと知るには、こちらのウェビナーをご確認ください。

http://tv.netapp.com/detail/videos/featured/video/5625603726001/data-insight-and-control-for-the-service-business-model-oci?autoStart=true

同社のGlobal OperationのディレクターであるJim Avazpour氏が、巨大なマルチサイトIT基盤の監視の難しさについて語っています。

※ 本記事はKurt Sand著「Want to Be a Hero? Prevent IT Problems Now!」を参考にしています。

ネットアップクラウドインフラストラクチャー構築ソリューション

RELATED POST関連記事


RECENT POST「次世代データセンター」の最新記事


ハイブリッド クラウド環境を監視、管理するには?
ハイパーコンバージドインフラも新たな世代へ NetApp HCI
NetApp All Flash FAS

RANKING人気資料ランキング

FlexPodクラウドアプライアンス
ブログ購読のお申込み