企業向けストレージはオールフラッシュがあたりまえ
企業向けストレージの世界において、フラッシュはもう当たり前の選択肢となっている。“部分的にフラッシュを活用する”という段階は過ぎ去り、オールフラッシュが一般的な解になりつつあるといっても過言ではないだろう。
なぜフラッシュを選択するのかと問えば、多くのユーザーは「速いから」と答えるに違いない。確かに、1台のハードディスクドライブ(SAS)のランダム・リードがだいたい200 IOPS(Input/Output Per Second)程度であるのに対し、1枚のフラッシュメモリ(SSD)は3万IOPSをたたき出す。これは魅力的なパワーだ。
しかし、ストレージに精通したユーザーの間では、「速さ」はフラッシュを選定する要因の1つに過ぎない。フラッシュのメリットを余すところなく享受するために、HDDとのハイブリッド型ではなく、オールフラッシュ型を選択するという。
オールフラッシュストレージの特徴の1つとして、非常に小さなレイテンシーがあげられる。SSDとHDDのハイブリッド型ストレージのレイテンシーは20ミリ秒ほどだが、高品質なオールフラッシュであれば3ミリ秒~1ミリ秒まで向上できる。
ハイブリッド型の弱点の1つに安定性がある。SSDのキャッシュがヒットしている間はよいが、ミスキャッシュが起きると途端にパフォーマンスが低下してしまう。常に高速性が求められるサービスには、あまり適するとは言えない。
消費電力が小さく、発熱が抑えられているという点もメリットだ。また、ハードディスクのように回転体がないため、衝撃に強く故障しにくい。
さらにハードディスクの技術は頭打ちになっており、将来性が乏しいという懸念もある。フラッシュはまだ発展途上にあり、将来の要求へ柔軟に応えられる可能性が高い。圧縮や重複排除といった最新のストレージソフトウェア技術の多くは、フラッシュのために開発されているものが多い。そうした効率化技術と組み合わせることで、大幅なコスト削減を実現できる可能性も高い。
これから新しいストレージを選定するのであれば、オールフラッシュを選ばない理由がないというわけだ。
オールフラッシュが貢献できるデータベースのタイプ
それでは、どのようなデータベースであれば、オールフラッシュの効果を最大化できるだろうか。
ストレージへのアクセスは、「ランダム・リード」「シーケンシャル・リード」「ランダム・ライト」「シーケンシャル・ライト」という4つのI/Oタイプに分けられる。データベースの適用場所によって、これらのI/Oタイプの頻度が変わると考えればよい。
例えば、オンラインショッピングサイトで欲しいアイテムを検索する──「8~10万円のWindows 10が稼働するPC、500GBのSSDを搭載」という条件で検索するようなケースでは、ランダム・リードが多用される。これは最も一般的な読み取り処理であり、ストレージ性能を最も要求するタイプだ。
シーケンシャル・リードは、データの最初から最後までがひとかたまりになった読み取り処理であり、例えば「1年間の売上データ分析」で特定のパターンを持つデータを探す処理などがあげられる。データベースI/Oの中では最もストレージ性能を要求しない処理である。
ランダム・ライトは、データベースI/Oの中でも頻度が小さい処理だ。例えば、データベースのライト・キャッシュがデータファイルに書き込みときの処理があげられる。通常はバックグラウンドで実行するものであるため、レイテンシーには敏感ではなく、オールフラッシュの貢献度は小さい。
シーケンシャル・ライトは、小さなデータの最初から最後までがひとかたまりになった書き込み処理である。例えば、「急な電源断からデータベースを保護するためのトランザクションログ」の書き込みや、非常に書き込み処理が多い環境での「Oracle Redo」などがあげられる。場合によってはユーザーやアプリケーションが書き込み処理の完了を待たねばならず、レイテンシーに敏感という特徴がある。これは、オールフラッシュが高速化に貢献できるタイプのI/Oと言えよう。
つまりオールフラッシュは、データベースI/Oの中でも、IOPSとレイテンシーに敏感なランダム・リードとシーケンシャル・ライトの高速化に役に立つというわけだ。最適化が図られたストレージであれば、1ミリ秒前後のレイテンシーを実現できる。ハードディスク時代には「レイテンシー 8ミリ秒」を目標にすることが多かったが、近代のビジネススピードにはもはや追いつかない。データベースに求められるIOPSとレイテンシーの双方を考慮して、オールフラッシュストレージを適用することが望ましい。
[RELATED_POSTS]
クラウド時代のデータベース4つの課題
次に、このクラウド時代におけるデータベースのアーキテクチャについて考えてみよう。
パブリッククラウドの利活用においても、ネットアップのストレージ技術は大いに活躍する。その理由として「可用性」「拡張性」「可搬性」「セキュリティ」があげられる。
クラウド時代のデータは常に利用できなければならず、信頼できるバックアップ先があり、迅速かつ確実にリストアできる環境が必要だ。データは常に増え続けるため、容量も性能も拡張性が重要視される。クラウドを最大限に活用するためには、データがどこでも必要とされる場所で利用でき、もちろん安全性も確保されなければならない。
パブリッククラウドでは、可用性を“月間使用可能時間割合99.95%以上”のように定めている。99.95%とは優秀に思えるが、1年に換算すれば4.5時間のダウンタイムが発生するということになる。また、バックアップデータのリストアのタイミングで「レイテンシーの著しい増加が発生する可能性がある」としているケースもある。
ストレージ性能も決して高いとは言えず、「3,000 IOPSにバーストできる」「ベースラインパフォーマンスは3 IOPS/GB」というような表現もよく見られる。「10ミリ秒未満のレイテンシー」を実現というような記述もある。
上述のようなサービスを利用して、500GB/5,000 IOPSのデータベースを構成したいとしよう。500GBを優先するのであれば、たった500×3=1,500 IOPSしか発揮できない。5,000 IOPSを実現したければ、5000÷3≒1,666GB(約1.7TB)もの容量が必要になってしまう。
つまり、パブリッククラウドのストレージでは、可用性は中途半端、性能の拡張性に乏しく、可搬性が確保できないという問題が生じてしまう恐れがあるのだ。
クラウド活用にも最適なネットアップのストレージ
こうしたクラウドサービスにおけるデータベースの課題を解決するため、ネットアップは「ONTAP Cloud」と「NetApp Private Storage」という2つの回答を提供している。
ONTAP Cloudは、“データベース in the Cloud”向けソリューションである。ONTAPをそのままクラウドに持ち込み、NetApp SnapMirrorの相手として選択することができる。
従来のディザスタリカバリーは、プライマリーサイトとセカンダリーサイトに同じ設備を設置して、レプリケーションを行っていた。SnapMirrorとONTAP Cloudを組み合わせることで、レプリケーション先としてパブリッククラウドを選択できるようになる。
クラウドであれば、稼働していないデータセンター、サーバー、ソフトウェアやテープに使用料金を払う必要はない。プライマリーサイトがダウンして、ディザスタリカバリーが必要なときだけ、使用料を払えばよい。
NetApp Private Storageは、“データベース near the Cloud”向けのソリューションだ。
例えば、オンプレミスで仮想サーバーや物理サーバーを運用している環境で、ストレージとしてAFF/FASを採用するとしよう。このとき、仮想サーバーをパブリッククラウドへと移行する。しかし、サーバーの柔軟性は高まるが、ストレージの課題は解決できない。
これを解決するためには、クラウドサービスに近いコロケーション施設にAFF/FASを設置すればよい。パブリッククラウドとの接続には、高速な専用線接続を利用することで、パフォーマンスを維持することができる。この構成を実現するのが、NetApp Private Storageというわけだ。
この構成であれば、データをクラウドに持ち込む必要がなく、クラウドとAFF/FASの双方のメリットを享受できる。ONTAP Cloudと組み合わせることで、データの可用性や拡張性、可搬性とセキュリティのすべてを実現できるというわけだ。
まとめ
これからの時代、ハイブリッドクラウドを前提としたアーキテクチャを選定することが重視されていくことだろう。ネットアップのONTAPストレージは、オンプレミスでもクラウドでもデータベース環境を最適化できる技術である。ぜひ優先的に検討していただきたい。
- カテゴリ:
- クラウド