こんにちは!
株式会社ネットワールド 高田です。(春、さくらの季節、花粉の季節、ですね。)
【ガチ検証】シリーズ 第6回目のその②は、NetApp AFF A200のVDI環境での試験実施内容と、試験結果に関してお伝えしていきます。当社が考えるVDIの試験ポイントや、当社自慢のVDI試験設備、試験環境に関しては、【ガチ検証】シリーズ 第6回目のその①をご参照頂ければと思います。
最初に免責事項です。
今回の公開する検証データは株式会社ネットワールドが独自の手法で実施した検証内容となりますので、以下のご理解をお願いします。
- 公開した検証データや実施内容は、お客様システム(お客様の導入システム、お客様の検証環境含むシステム)や、メーカーの製品性能(当社独自検証の為、メーカー見解は含まれません)を、保証する内容ではありません。
- 試験実施環境や試験実施シナリオ・手順、ツールの特性、ツールバージョン、ハードウェア構成・種類・世代・ソフトウェアバージョン、データ取得方法・タイミング 等に応じて、結果は異なる可能性が御座います。
上記をご理解頂き、参考情報として御覧頂ければと思います。
試験内容に関して
最初にお伝えしておかないといけないのですが、今回掲載する検証は、2016年後半に実施した検証内容となりますので、最新バージョンでの実施は出来ておりませんので、現在のバージョンで実施した際との乖離がある可能性がありますので、ご了承下さいますよう、お願いいたします。
ここから、試験内容(実施した試験項目)と、その結果の確認方法、取得内容に関して記載いたします。
試験対象の仮想マシン数 = 1000台(試験での実行数 =1200ユーザで実施)
・1000ユーザが試験ターゲットですが、20%程度の余剰を持たせて試験実施
※LoginVSI試験実施時に、アクセス等の問題(セッション時間等)でログオン自体に失
敗するユーザが発生する場合があるので、当社ではターゲットユーザよりも10%~
20%程度多めのユーザで試験を実施致します。
試験内容は、以下の3つの試験を実施
- ブート試験(Bootストーム検証)
- ログオン試験(Login ストーム検証)
- ワークロード試験(LoginVSI 規定ワークロード検証/Medium Workload)
※LoginVSI Medium Workloadの詳細は以下のURLをご覧ください。
https://www.networld.co.jp/loginvsi/workload.htm
VDI試験内容 / 確認方法/ 取得物を纏めると、以下の感じになります。
※NetAppストレージは基本的に、Sysstatを1秒間隔で取得して解析します。
※LoginVSIでは、Login Timer値(ユーザ毎のログオン時間)と、VSI Max値を基本の取得内容としています。
ではここからNetApp AFF A200 / 1000user VDIの検証結果について記述していきます。
[RELATED_POSTS]
ブート試験(Bootストーム検証)の結果(AFF A200 1000user VDI)
ブートは1000台の仮想マシンを一斉に起動致します。ですが、実際はVMware側で同時起動する仮想マシン数の閾値があり、8VMずつ順に起動してきます。ですので起動時間は高速なストレージでも時間はあまり変わりませんでした。VMware側で同時起動のチューニング等は実施しておりません。ストレージ側のIO状況に関してサマリを記載していきたいと思います。
ブート時間 / Read比率の結果について
※❶:起動時間は、約25分(他のモデルでもあまり大きな差はありませんでした。)
※❷:Read率の平均は85%ですが、Peak時はほぼ90%以上を推移。
ストレージ性能結果:IOPS値 /帯域Mbps(NetApp Sysstat情報)
※❸:IOPSは、約60,000~約90,000 IOPSの間で推移(AFF A200の性能限界値)
※❹:帯域は、約6Gbps ~ 14Gbpsの間で推移 --- Network はIn-Out両方のトラフィックを合算しているが、BootはReadが90%近くの為、ほぼ10G ×2本 の帯域環境。
IOブロックサイズ / コントローラCPU利用率(NetApp Sysstat情報)
※❺:平均ブロックサイズ= 12KB~20KB。もう少し大きいと予測していました。
※❻:AFF A200 CPU利用率 =ほぼ100%張り付き状態。なので、1000ユーザのブートストームでは、CPUがボトルネックとなっていると判断できます。
※当社は上位モデルや他ストレージ製品でも同様の試験しておりますが、ブート処理の各社IOPS値は異なりますが、ブート時間はそこまで大きな差は感じられなかったです。
ログオン試験(ログオンストーム検証)の結果(AFF A200 1000user VDI)
次にログオン試験に関してですが、ログオン試験はLoginVSIを利用して試験します。
LoginVSIは連続的にログイン処理を実行します。その際にコネクションに失敗してログインが出来ないユーザが出てきます(失敗するとスキップします)。なので当社では余剰ユーザを20%程度確保、今回は1200ユーザで試験をしています。あとプロファイルサイズは5MB / 20MB / 50MB / 100MB の4種類(ユニークデータ)を利用して実行します。
早速結果を見ていきたいと思います。
ユーザプロファイル 5MBのログオン試験結果(ログオン成功数)
※❶❷:ログオン成功数は、1200ユーザの内、1184ユーザが成功。1000ユーザをターゲットとして、超えているので試験として問題ないと判断しています。
LoginVSIログオンタイマー(ユーザあたりのログオン時間計測)
※❸:結果から、5MBプロファイル 同時1000ユーザのログインはAFF A200で快適にログオンは出来たと考えられます。LoginVSIのログオン時間はログオン実施後に1つアプリケーション実行した際のタイムスタンプを計測していますので、実環境ではもう少し高速に立ち上がります。当社では過去の知見から、ログイン時間:40秒未満であれば快適な環境だと判断しています。
※グラフ後半(右側)を見ると、1100ユーザを超えたあたりで、ログイン時間が長く(遅く)なっていることが確認されました。
ログオン検証時のストレージ(NetApp AFF A200)の性能情報をここから記載します。
Read比率 / IOブロックサイズ (NetApp Sysstat情報)
※❹:Read / Write比率は、約90%がWriteの結果。Login時にユーザプロファイルをダウンロードする為、ストレージに対してWrite IO負荷がかかる。
※❺:ログイン時のBlock Sizeは、10KB前後で推移したが、プロファイル種類(データ種類)にも依存される。
ストレージ性能結果:IOPS値 /帯域Mbps(NetApp Sysstat情報)
※❻:IOPSは、約25,000~約45,000 IOPS程度の間を推移した。
※❼:帯域は、約2.2Gbps程度を推移 : プロファイルなので細かいアクセスが多い為、基本的には帯域負荷はそれ程大きくない。
コントローラ CPU利用率(NetApp Sysstat情報)
※❽:AFF A200 CPU利用率 = 60%~80%を推移。コントローラ性能としては100%には張り付いてはいない状態でした。
上記の試験結果(5MB)以外に、プロファイルサイズ 20MB / 50MB / 100MB でも実施して試験結果を纏めていますが、全てを記載するのは大変なので、他はサマリとしてご紹介いたします。
プロファイルサイズに応じたログイン時間 / コントローラCPU利用率
試験結果から、プロファイル要件(データ容量、データ種類)に応じて、ログイン時間は大きく異なることが分かりました。A200の性能は、5MBであれば1000ユーザのログオン環境は快適に動作できそうですが、20MB、50MB、100MBになると、1000ユーザ全てを快適にログオンさせることは難しいかと思います。結果から1000ユーザ規模だとAFF A300以上が望ましいと思います。
一般的な話ですが、VDIはプロファイルデータを小さくする、可能な限りフォルダリダイレクト機能を用いて、ログイン時のクライアント(ゲストOS)へのデータ書き込み容量を減らす事が重要。プロファイルサイズが大きいユーザ(ユーザ要件、アプリケーション要件)は、ログイン時間の分散(一斉ログインを減らす)、特定サーバへのアクセス集中の分散(クラスタの分散、マスター展開先の分散等)、システム環境強化(サーバCPU Core数、Memoryサイズ、Network帯域、Storage性能)への配慮が必要となります。
ワークロード試験の結果(AFF A200 1000user VDI)
最後にワークロード試験の結果ですが、通常業務の負荷はログオン負荷よりも低いことが一般的ですので、ユーザ数は1100ユーザ(10%余剰)で実施致しました。LoginVSIの結果のみ記載いたします。(細かい詳細な結果情報が欲しい方は当社までご連絡ください。)
※LoginVSIでの試験ワークロードのタイプは、『Medium Workload』で実施いたします。
※Medium Workloadの詳細は、以下のURLをご参照ください。
https://www.networld.co.jp/loginvsi/workload.htm
LoginVSIミディアムワークロード試験の結果
※LoginVSI Medium Workload試験結果では、VSI MAXが「not reached(1000ユーザでは上限に届かない)」の結果となった。Medium Workloadの業務ワークロードでは、AFF A200ストレージ環境で快適に動作した結果となる。
【ガチ検証】
第6回:NetApp AFF A200 の1000user VDIの性能検証レポートは、ここまでとなります。皆さまのご参考になればと思います。NetApp A200 1000user VDI 検証の詳細レポートは別途まとめていますので、ご興味ある方はお問合せ頂ければと思います。
また、AFF A200は単体の様々なワークロード(125パターン)の性能検証も、第2回:NetApp AFF A200の性能検証レポート で記載させて頂いております。今回内容にRead比率やBlockSizeも記載していますので、検証結果と照らし合わせて比較しても、面白いかと思います。検証結果のご説明、ご質問あれば、ネットワールドまでご連絡頂ければと思います。
他にも【ガチ検証】シリーズ連載しております。当社のSEが実施した、少しマニアな真面目な検証シリーズですので、是非ご参照頂ければと思います。
【ガチ検証】NetApp ALL Flash性能の全貌公開!(門外不出の検証データ)編
- 第1回:検証の目的と検証内容の説明
- 第2回:NetApp AFF A200の性能検証レポート
- 第3回:NetApp AFF A220 vs A200の性能検証レポート
- 第4回:NetApp AFF A300の性能検証レポート
- 第5回:NetApp AFF A700sの性能検証レポート
- 第6回:NetApp AFF A200の1000user VDIの性能検証レポート:その①
- 第6回:NetApp AFF A200の1000user VDIの性能検証レポート:その②
- 第7回:NetApp HCI(Solidfire)の性能検証レポート
- 第8回:NetApp ONTAP Select の性能検証レポート
- 第9回:NetApp A220 FabricPool(AWS)の性能評価レポート
最後に、【ガチ検証】の検証結果は、別途 詳細ドキュメントとしても作成する予定です。
詳細レポートが欲しい方は、以下のお問合せ窓口に、【ガチ検証:検証レポート 希望】と記載頂き、メール頂ければと思います。
株式会社ネットワールド
お問合せ窓口:netapp-info@networld.co.jp
【注目ブログ】
ネットワールド らぼ(ちょっとユニークな技術情報ブログ)
https://blogs.networld.co.jp/main/netapp/
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
株式会社ネットワールド
ストラテジック・プロダクツ営業部 高田 悟
NetApp歴は11年目、仮想化/ネットワーク/ストレージ/HCI等、インフラ全般を担当。多くの斬新なセミナーを実施(SEとの掛け合いセッションやマルチベンダーでのガチンコセミナー等での人気講師)、営業職でありながら大規模案件のPMやコンサルも行う。
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
最新情報お届け!Twitter / Facebook のフォローもお願いします!
- ネットワールドFacebook (@Networld.TeamNetApp)
- Networld Twitterアカウント(@nw_netapp)
- カテゴリ:
- オンプレ
- キーワード:
- NetApp