近年のITインフラの運用は、オンプレミスとクラウドを合わせたハイブリッドクラウド環境が増えています。ハイブリッドクラウドには大きな利点がありますが、一方でインフラが複雑化するという問題もあります。
特にインフラ監視は、大きな負担がかかります。そこで監視業務をシステム化して、複雑なITインフラを統合的に管理しましょう。
インフラ監視とは
ITにおけるインフラとは、PC、サーバ、ネットワーク、DB、OSなどを指します。これらはITにおいては欠かせない要素であり、常時稼働していなければいけません。特にネットワークやサーバは、使用している限り負荷がかかっているうえ、近年はサイバー攻撃などの問題もあります。そのため、異常が起きないように、インフラの監視・管理を適切に行わなければいけないのです。
しかし、企業のITインフラの規模は大きいため、人の手で監視を行うには相当な人的リソースが必要となります。これを避けるためには、インフラを統合的に監視できるツールの導入が必要です。
インフラ監視とインフラ管理の違い
インフラの監視・管理は、安定的な稼働においてとても重要です。この2つは一見似ていますが、それぞれ意味合いが異なります。
インフラの監視は、現在の状態をリアルタイムで監視して状態を評価します。そして、問題があった場合には、インフラ管理に知らせます。インフラ管理は、インフラ監視によって発生した問題を解決する工程です。これら監視と管理の2つを適切に行うことで、インフラを安全に運用できるのです。
インフラ監視はなぜ必要なのか
インフラ監視がなぜ必須であるのかを解説します。
リソースの使用率を監視しサーバダウンを防ぐ
サーバダウンの原因に挙げられるのが、リソース不足です。リソースが不足すると、サーバに大きな負荷がかかってしまってダウンしてしまいます。復旧するまで業務やサービスが停止するため、企業にとっては大きな損害となります。
また、近年は、使用データ容量によってコストが変動するクラウドサービスが多くあります。そのため、リソースを最適化すれば、コスト削減にも繋がります。
大規模障害を事前に防ぐ
インフラの拠点で障害が発生すると、関連する全てのシステムに弊害を及ぼします。これを大規模障害と呼びます。小規模なものより発生確率は低いと思う方もいるかもしれませんが、全国で見ると定期的に発生している問題です。
近年で有名なのは、みずほ銀行の大規模障害です。2021年〜2022年に起こった大規模障害では、窓口のサービスやインターネットバンキングが停止して、ATM障害も発生しました。
https://xtech.nikkei.com/atcl/nxt/column/18/01972/030300001/
このような問題は、企業の信用が失われてしまうため絶対に回避したい問題です。
セキュリティ対策
年々サイバー攻撃の手法は進化をしており、それに対応した策が必要です。たとえば、近年主流となっているウイルス攻撃に、ランサムウェアがあります。これは企業のPCをランサムウェアに感染させて、内部のファイルを改ざんするサイバー攻撃です。
ファイルの暗号化やPCロックなどがかけられてしまうので重要なデータが使用できなくなり、攻撃者は修復と引き換えに身代金を要求します。とても厄介な攻撃ですが、ファイルレベルでの監視ができるツールもあり、事前に防ぐことも可能です。
コンプライアンス遵守
企業の重要なデータは、内外からのリスクに常にさらされています。そのため、「サイバー攻撃」「不正アクセス」「データ持ち出し」など、多くの問題に対処しなければいけません。
インフラ監視ではこうした問題に対処するために、ユーザーの動作を解析してデータが流出するのを事前に防ぎます。特にファイルレベルの監視をすることで、ファイルに対する不審なアクセスを遮断できるのです。
インフラ監視では具体的に何を監視するのか
インフラの監視で実際に行う業務を解説します。
死活
サーバの稼働状況を監視して、サーバダウンが起きないようにすることを「サーバの死活監視」といいます。「表示速度」「画面遷移」「URL応答」などの反応を監視して、異常がないかを確認します。
監視は、Pingコマンドによって応答の確認をしたり、実際に動作チェックを行ったりします。また、監視専用ツールを使用すると、GUI上で簡単に稼働状況の確認が可能です。
ハードウェア
インフラにおけるハードウェアは、「PC」「サーバ」「ストレージ」などを指します。ハードウェアの監視では、これらのハードウェアに物理的な問題がないかを確認します。
具体的な監視項目は、「CPU」「メモリ」「電源」「バッテリー」「ファン」などです。これらには状態を検出するセンサーが付属しており、外部からでもネットワークを通じて状態が確認できます。また、複数ベンダーによるハードウェアが混在している場合は、全てを手動で監視するのは困難です。そのため、一括で監視できるツールを利用するといいでしょう。
ネットワーク
ネットワークに異常が発生すると、「動作の遅延」や「アクセス遮断」が起こります。これを防ぐために、ネットワーク機器やサーバの状況を監視します。監視方法は、「Pingコマンド」を送る方法がありますが、近年では専用ツールを使うことが多くなっています。専用のツールでは、設定した値を下回った場合にアラートを出すなどの対処方法が可能です。
アプリケーション
アプリケーションをリリースしたあとは、運用をしなくてはいけません。稼働状況の悪化によっては、サービス運営が厳しくなり信用問題に発展することもあります。
そのため、アプリケーション監視では、ログの監視を行ってエラーがないかを確認します。また、監視ツールでは、ポリシーを定義して違反があった場合に、アラート通知を出すことが可能です。近年は、クラウドで利用する監視ツールも登場しています。
パフォーマンス
インフラの監視では、安定的な稼働を行うためにITインフラのパフォーマンス状況も確認します。確認する内容は、「ネットワーク」「メモリ」「ストレージ」「CPU」などです。これらにしきい値と呼ばれる正常・悪化の境となる値を設けますが、これを下回った場合に異常値とみなされます。
問題への対応では、「リソースの強化」「スケールアウト」「帯域幅の見直し」「通信制限」などを行います。パフォーマンスを監視して適正に保つことで、「安定的な業務稼働」と「コスト最適化」が可能です。
インフラ監視ツール Cloud Insightsを紹介
インフラ監視ツールの1つである「Cloud Insights」をご紹介します。
Cloud Insightsの機能
Cloud Insightsの最大の特徴は、オンプレミスとクラウドで構成した「ハイブリッドクラウド」のシステムを統括的に監視できるという点です。ハンブリッドクラウド環境は、システムが複雑となりインフラ監視も容易ではありません。そこでAIエンジンを設けることで、これまでの状況から予測と異常を監視します。
さらにランサムウェアに対応したシステムとなっており、不審な動きから攻撃の可能性があるものの判定が可能です。これらの監視は、GUIによって現在の状況をわかりやすく統合的に管理できます。
Cloud Insightsを導入するメリット
Cloud Insightsは、前述したように複雑なインフラ環境を一括で管理が可能です。さらにAIなどの分析ツールを備えることで、管理者の負担を減らします。
これにより問題が起きた時から解決までの時間が最大で90%削減できるうえ、問題を常に把握できるため、サービス利用者に影響が出る問題が80%抑制されます。さらに、インフラ状況の最適化と効率的な監視によって、コストを平均で33%削減できるのです。このようにCloud Insightsでは、「障害発生の防止」「解決時間の短縮」「コスト最適化」の3つのメリットがあります。
まとめ
NetAppのCloud Insightsは、オンプレミスとクラウドが混在した複雑なITインフラを統合的に管理します。わかりやすいGUIの提供とAIなどの最新技術によって、管理者は効率的に状況を把握できるのです。
さらに年々新しくなるサイバー攻撃にも対応しています。近年、台頭しているランサムウェアにも対応しており、さまざまな脅威から企業の重要なデータを守れるでしょう。また、インフラのパフォーマンスを常に最適化することで、コストの増大を防げます。
新しい時代のITインフラに対応するためにも、インフラ監視のシステム化を推進していきましょう。
- カテゴリ:
- ハイブリッド
- キーワード:
- インフラ