SQL Server パフォーマンスチューニング、コンサルティング、アドバイス、相談、定期診断、トレーニング

ホーム＞技術情報＞ SQL Server 2012 自習書 No.12 Analysis Services によるインメモリ BI 入門

SQL Server 2014 実践シリーズ（HTML 版）
「No.1 インメモリ OLTP 機能の実践的な利用方法」

松本美穂と松本崇博が執筆した SQL Server 2014 実践シリーズの「No.1 インメモリ OLTP 機能の実践的な利用方法」の HTML 版です。日本マイクロソフトさんの Web サイトで Word または PDF 形式でダウンロードできますが、今回、HTML 版として公開する許可をいただきましたので、ここに掲載いたします。[2015年12月29日]

目次へ | 前のページへ | 次のページへ

4.8　フルスキャンを避ける（インメモリ OLTP の苦手な処理）

ここまでは、インメモリ OLTP が得意な処理に関して見てきましたが、もちろん苦手な処理もあります。それはフルスキャン（全スキャン）が発生するような場合です。これは、前項の範囲検索のところでも少し出ていますが、HASH インデックスを利用している場合に、範囲検索を行ったとすると、Index Seek にはならず、Table Scan または Index Scan が行われてしまい、桁違いに遅くなってしまう（前項ではネイティブコンパイル SP 利用時に 82倍、直接 SQL を実行した場合に 172倍も遅くなってしまう）というものです。このスピードは、ディスクベースでのフルスキャンよりも遅いものなので、注意しなければなりません。

◆ インメモリ OLTP のフルスキャンのスピード

ここでは、col2 の検索（取得件数が約 5件になる検証）で利用したのと同じテーブル（1,000万件のデータ）で説明します（以下）。

00277

前述のテストでは、col2 列へインデックスを作成している場合は、「WHERE col2 = ～」のように「=」演算子を利用した検索は、次のように Index Seek になることを説明しました。

00278

また、この検索は、ディスクベースよりも、インメモリ OLTP のほうが速く結果を取得できることも確認しました（約1.3倍速い）。

これに対して、「WHERE col3 = ～」のように、インデックスを作成していない列（col3）を利用した場合の検索は、次のようにフルスキャン（Table Scan または Index Scan）になります。

00279

このように、フルスキャンになる検索を、次のように SET STATISTICS TIME コマンドを利用して実行時間を計測してみます。

00280

結果は、次のようになりました。

00281

00282

結果は、ディスクベースでの全スキャンに比べて、HASH インデックスでも bw-tree インデックスでも桁違いに遅くなることが分かりました（強いて言えば、bw-tree インデックスが速いのですが....）。Hash Hash の 27倍遅いというのは、仮にディスクベースが 100ミリ秒で完了したとすると、Hash Hash では 2.7秒もかかってしまうという意味で、この差は非常に大きいものです。

◆ ネイティブコンパイル SP を作成するとフルスキャンにも効果がある

次に、ネイティブコンパイル SP を作成した場合の性能差を確認してみました。

00283

この場合の結果は、次のようになりました。

00284

00285

結果は、どのパターンも、直接 SQL を実行するよりも、ネイティブコンパイル SP を利用したほうが速く実行できることを確認できました（Hash Hash は 27倍遅かったところが 13倍、bw bw は 21倍遅かったところが 13倍へ改善）。

このように、ネイティブコンパイル SP を作成すれば、フルスキャンの性能を上げることができますが、これでもディスクベースよりも 10倍以上遅い（仮にディスクベースが 100ミリ秒なら、インメモリ OLTP では 1秒かかってしまう）ことに気を付けなければいけません（インメモリ OLTP は、フルスキャンが苦手です）。

したがって、インメモリ OLTP を利用する場合には、フル スキャン（全スキャン）にならないように、検索で利用する列に対して、インデックス（HASH または bw-tree）を確実に作成／付与しておくことが非常に重要になります。また、範囲スキャンを避けるには、bw-tree インデックスを活用することもポイントになります。

Tips：ディスクベースではフルスキャンが Parallel 処理される～並列実行～
ディスクベースでのフルスキャンが速い理由の 1つには、パラレル処理があります。これは、次のような状況です。
00286

パラレル処理されているかどうかは、実行プランの黄色いアイコン（ ← が２つあるもの）で確認することができます。これで、仮に CPU 時間が 400ミリ秒かかるような処理の場合に、4コアの CPU であれば 100～200ミリ秒ぐらい（∵ 4コア＝4倍の性能にはならないため）で実行できるようになります。

◆ インメモリ OLTP は全データを対象とした処理が苦手～集計処理など～

前述したように、インメモリ OLTP では、フルスキャン（全スキャン）が遅いので、全データを対象とした集計処理も苦手です。これは、次のようなクエリです。

00287

このクエリは、WHERE 句での絞り込みを行わないで、全データ（1,000万件）を対象としています。このような集計処理は、col2 列に HASH インデックスを作成していても、Table Scan（全スキャン）になってしまいます。

この処理を性能比較すると、次のようになります。

00288

00289

col2 列に HASH インデックスを作成している場合は 22.5倍も遅くなり、bw-tree インデックスを作成している場合は 3.6～3.7倍遅くなることを確認できました。これは、仮にディスクベースでの結果が 500ミリ秒だったとすると、22.5倍では 13.5秒、3.6倍では 1.8秒もかかってしまうということを意味しています。

bw-tree インデックスのほうが性能が良い理由は、Table Scan ではなく、次のように Index Scan で行われているためです。

00290

しかし、bw-tree インデックスのほうが性能が良いとは言っても（HASH インデックスの場合の 22.5倍に比べれば断然速いですが）、ディスクベースと比べると約 3.6倍も遅いわけです。したがって、このような全データを対象とした集計処理を頻繁に行っている場合には、注意してください。

◆ col3 列（インデックスを付与していない列）で GROUP BY を行った場合

col2 列ではなく、col3 列（インデックスを作成していない列）で、GROUP BY 演算を行った場合は、次のような性能結果になります。

00291

00292

col3 での GROUP BY の場合は、ディスクベースでも、インメモリ OLTP でも、どのパターンでも Table Scan になりますが（正確には、ディスクベースでは Clustered Index Scan）、やはりディスクベースよりも 2倍以上も遅い結果となりました。差が小さくなったのは、col2 列の GROUP BY の結果が 200万件であったのに対して、col3 では 10万件であったためです。

Note：インデックスを付与していない列を利用すると初回実行が遅い～統計の自動作成～
col3 のようにインデックスを付与していない列を GROUP BY 句や WHERE 句の検索条件に指定すると、初回実行時に自動的に統計が作成されるので（_WA_Sys_～という名前）、初回実行が遅くなります（統計の作成処理の負荷もインメモリ OLTP のほうが遅くなります）。
00293

◆ col4 列（インデックスを付与していない列）で GROUP BY を行った場合

次に、col3 と同様、インデックスを作成していない col4 列で GROUP BY 演算を行ってみます。この場合は 1,000件の結果が返ります。

00294

この場合の性能結果は、次のとおりです。

00295

インメモリ OLTP の結果は、いずれもディスクベースよりも 6倍以上遅い結果となりました。

col2、col3、col4 の結果を同じスケールにしてまとめると、次のようになります。

00296

Index Scan でも Table Scan でも、インメモリ OLTP のほうがディスクベースよりも遅いことを確認できると思います。なお、このテストでは、GROUP BY の結果を一時テーブルへ書き込んでいますが、ディスクベースの場合は、次のようにパラレル処理（Parallel Insert）が可能で、その分の性能差も現れています。

00297

◆ フルスキャンにはクラスター化列ストアインデックス（CCSI）を利用

インメモリ OLTP は、フルスキャンが苦手ですが、SQL Server 2014 には、フルスキャンが得意な機能として「クラスター化列ストアインデックス」（CCSI：Clustered Column-store Index）もあります。これは、カラム型データベース（列指向データベース）の SQL Server 実装で、SQL Server 2014 からの新機能です（SQL Server 2012 でも、非クラスター化列ストアインデックス機能を利用することで、読み取り専用で利用することもできます）。

クラスター化列ストアインデックスは、次のように作成することができます。

CREATE CLUSTERED COLUMNSTORE INDEX インデックス名
ON テーブル名

CREATE CLUSTERED COLUMNSTORE INDEX ステートメントで、インデックス名（画面は idx1）を指定し、ON 句でテーブル名（画面は CCSI_table）を指定すれば、作成が完了です。このようにクラスター化列ストア インデックスを作成すると、集計処理のパフォーマンスが大幅に向上します。

クラスター化列ストアインデックスを利用して、col2、col3、col4 の GROUP BY演算（1,000万件のデータ）を行った結果は、次のようになります。

00299

col2 列の集計処理では 2倍、col3 列では 1.7倍、col4 列では 36倍も速い結果になっています（col4 が桁違いに速いのは、結果件数が 1,000件と少ないためです）。このように、クラスター化列ストアインデックスを利用すれば、圧倒的な集計パフォーマンスを実現することができるので、集計処理が中心のシステムの場合には、検討してみることをお勧めします（インメモリ OLTP とクラスター化列ストアインデックスは、同じテーブルに対して設定することはできないので、集計処理を強くしたい場合にはクラスター化列ストアインデックスがお勧めになります）。

クラスター化列ストアインデックスについては、本実践シリーズの「SQL Server 2014 への移行／アップグレード」編でも詳しく説明するので、こちらもぜひご覧いただければと思います。

目次へ | 前のページへ | 次のページへ