SQL Server のことなら SQL Quality SQL Server パフォーマンス チューニング、コンサルティング、アドバイス、相談、定期診断、トレーニング

ホーム > 技術情報 > SQL Server 2012 自習書 DWH 関連の新機能

SQL Server 2012 自習書シリーズ (HTML 版)
新機能編 No.3「DWH(データ ウェアハウス)関連の新機能」

松本美穂と松本崇博が執筆した SQL Server 2012 自習書シリーズの「新機能編 No.3 DWH 関連の新機能」の HTML 版です。 日本マイクロソフトさんの Web サイトで Word または PDF 形式でダウンロードできますが、今回、HTML 版として公開する許可をいただきましたので、ここに掲載いたします。[2014年12月26日]

目次へ | 前のページへ | 次のページへ

2.1 列ストア インデックスによる飛躍的な性能向上

◆ 列ストア インデックスによる飛躍的な性能向上

列ストア インデックスは、大量のデータに対する集計処理で大きな性能向上を期待できる新機能です。特に、夜間バッチ処理時(夜間バッチでの日次集計や月次集計処理など)や、DWH(データ ウェアハウス)環境での集計処理に大変役立つ機能です。

列ストア インデックスは、SQL Server 2008 R2 PowerPivot for Excel で実装されたインメモリのカラムベース エンジンxVelocity エンジン)を RDB へ応用したものです。このエンジンでは、列単位でインデックスを格納し、それらは高度に圧縮されています。

◆ 列ストア インデックスの効果(弊社事例:1.2億件で 25~100倍の性能向上)

弊社のお客様データ(1億2千万件の DWH)を利用して、列ストア インデックスの性能効果を検証したところ、以下のような結果が得られました。

00016

検証で利用したのは売上データが 1億2千万件格納されている「売上」テーブルで、このテーブルには「売上年月」、「売上金額」、「売上数量」列などがあり、以下の SELECT ステートメントを実行したときの結果を比較しました。

-- DISTINCT
SELECT DISTINCT 売上年月 FROM 売上
-- GROUP BY
SELECT 売上年月SUM(売上金額), SUM(売上数量FROM 売上 GROUP BY 売上年月

グラフの FullScan は、インデックスが使用されないフル テーブル スキャンが実行されたときの速度、IndexScan は、非クラスター化インデックスを(売上年月, 売上金額, 売上数量)で作成/利用したとき、ColumnStore が列ストア インデックスを作成/利用したときの実行速度です。ベンチマーク結果の公開は、使用許諾契約書で禁じられているので、グラフ内の結果は、それぞれ列ストア インデックスでの実行時間を 100 とした場合の相対値で表しています。

列ストア インデックスを利用することで、DISTICT 処理では、フル スキャンに比べて 102倍、インデックス スキャンに比べて 59.7倍の性能向上、GROUP BY 処理では、フル スキャンに比べて 46.9倍、インデックス スキャンに比べて 25倍もの性能向上を確認することができました。なお、各テストで使用したデータは、すべてメモリ上のデータ バッファ キャッシュ内へ格納されている状態でテストしました。したがって、初回アクセス時の(メモリ内にデータが存在しない場合の)ディスクからの読み取りが伴う場合には、さらに性能差が顕著に現れることになります。

今回の結果の 25倍という差は非常に大きいもので、たとえば次のような「売上年月ごとの売上金額を表示するレポート」を思い浮かべてみてください。

00017

このレポートを表示するのに今まで 10秒かかっていたとします。ここに列ストア インデックスを利用できるとすれば、25倍もの性能向上が得られるので、わずか 0.4秒10秒の 25分の 1 のスピード)でレポートが表示されるわけです。コンピューターの世界では、3秒以上の待ち時間があったとすると、ユーザーが "遅い" と感じると言われています。しかし、従来のインデックスの作成方法では、データ件数の規模が数億件レベルになる場合には、数秒間もの待ち時間が発生してしまうのです。これを列ストア インデックスに変更することができれば、1秒以内でのレスポンスを期待できるようになります。

また、列ストア インデックスは、このように GROUP BY 演算などによる集計処理で大きな効果を発揮するので、夜間バッチ処理時(夜間バッチでの日次集計や月次集計処理など)にも大きな性能向上を期待できます。

目次へ | 前のページへ | 次のページへ

事例1

MPNロゴ


SQLQualityは執筆とセミナーを通じて技術の啓蒙やエンジニアの育成支援も行っています
最新刊
SQL Server 2012 の教科書
SQL Server 2012 の教科書(ソシム)

弊社オリジナル制作の
SQL Server 2012 自習書も
マイクロソフトのサイトで公開中!
ロングセラー
ASP.NET でいってみよう  SQL Server 2000 でいってみよう
ASP.NET でいってみよう
第7刷 16,500 部発行
SQL Server 2000 でいってみよう
第12刷 28,500 部発行


セミナー風景
セミナー風景

弊社執筆の
SQL Server 2012 自習書
マイクロソフトのサイトで公開中
全30冊
ダウンロードはこちら
弊社執筆の
SQL Server 2008 R2 自習書
マイクロソフトのサイトで公開中
全30冊
目次はこちら
松本美穂のコラム
(公開活動などのお知らせ)

第38回: SQL Server 2014 CTP2 の公開
第37回: SQL Server 2014 CTP1 の自習書をご覧ください
第36回: SQL Server 2014 CTP1 のクラスター化列ストア インデックスを試す
第35回: SQL Server 2014 CTP1 のインメモリ OLTP の基本操作を試す
第34回: GeoFlow for Excel 2013 のプレビュー版を試す
第33回:iPad と iPhone からの SQL Server 2012 Reporting Servicesのレポート閲覧
第32回:PASS Summit 2012 参加レポート
第31回:SQL Server 2012 Reporting Services 自習書のお知らせ
第30回:SQL Server 2012(RTM 版)の新機能 自習書をご覧ください
第29回:書籍「SQL Server 2012の教科書 開発編」のお知らせ
第26回:SQL Server 2012 の Power View 機能のご紹介
第25回:SQL Server 2012 の Data Quality Services
第24回:SQL Server 2012 自習書のご案内と初セミナー報告
第23回:Denali CTP1 が公開されました
第22回 チューニングに王道あらず
第21回 Microsoft TechEd 2010 終了しました
第20回 Microsoft TechEd Japan 2010 今年も登壇します
第19回 SQL Server 2008 R2 RTM の 日本語版が公開されました
第18回 「SQL Azure 入門」自習書のご案内
第17回 SQL Server 2008 自習書の追加ドキュメントのお知らせ
第16回 SQL Server 2008 R2 自習書とプレビュー セミナーのお知らせ
第15回 SQL Server 2008 R2 Reporting Services と新刊のお知らせ
第14回 TechEd 2009 のご報告と SQL Server 2008 R2 について
第13回 SQL Server 2008 R2 の CTP 版が公開されました
第12回 MVP Summit 2009 in Seattle へ参加

技術コミュニティでも活動中

Microsoft MVP for SQL Server

松本崇博 Blog(SQL Server Tips)
松本美穂ブログ(SQL Serverノート)