SQL Server のことなら SQL Quality SQL Server パフォーマンス チューニング、コンサルティング、アドバイス、相談、定期診断、トレーニング

ホーム > 技術情報 > SQL Server 2012 自習書 DWH 関連の新機能

SQL Server 2012 自習書シリーズ (HTML 版)
新機能編 No.3「DWH(データ ウェアハウス)関連の新機能」

松本美穂と松本崇博が執筆した SQL Server 2012 自習書シリーズの「新機能編 No.3 DWH 関連の新機能」の HTML 版です。 日本マイクロソフトさんの Web サイトで Word または PDF 形式でダウンロードできますが、今回、HTML 版として公開する許可をいただきましたので、ここに掲載いたします。[2014年12月26日]

目次へ | 前のページへ | 次のページへ

4.4 データ品質プロジェクトの作成

◆ データ品質プロジェクトの作成

ナレッジ ベースの効果(シノニムの設定やドメイン ルールの効果)を検証したい場合は、データ品質プロジェクトを作成することで行うことができます。次の画面は、シノニムの効果を確認しているときの様子です。

00119

◆ Let's Try

それでは、これを試してみましょう。

1.データ品質プロジェクトを作成するには、次のように[新しいデータ品質プロジェクト]をクリックします。

00120

2.新しいデータ品質プロジェクト]ページが表示されたら、[名前]に「取引先クレンジング1」など任意のプロジェクト名を入力して、[ナレッジ ベースを使用]で前の Step で作成したナレッジ ベース(KB取引先)を選択します。

00121

アクティビティの選択]では[クレンジング]を選択して、[作成]ボタンをクリックします。

3.次の[マップ]ページでは、[データ ソース]で「SQL Server」、[データベース]で「DQStest」、[テーブルまたはビュー]で「取引先マスター」を選択します。

00122

マッピング]セクションでは、[基になる列]と[ドメイン]で、「取引先コード」と「取引先名」がそれぞれ対応するように選択して、[次へ]ボタンをクリックします。

4.次の[最適化]ページでは、[開始]ボタンをクリックします。

00123

これでナレッジ ベースに基づいたクレンジング処理が開始されます。

5.クレンジングが完了すると、次のように表示されます。

00124

修正されたレコード]が「2」、[無効なレコード]が「2」と表示されていることを確認できます。これは、[修正されたレコード]は、シノニムを設定したデータで、[無効なレコード]は、作成したドメイン ルールに違反しているデータです(次のページで確認できます)。

確認後、[次へ]ボタンをクリックして、次のページへ進みます。

6.次の[結果の管理と表示]ページでは、[ドメイン]で「取引先コード」を選択して、[無効]タブをクリックします。

00125

作成したドメイン ルール(長さが 5文字先頭がTRで始まる)に違反しているデータが 2件(TR0333XX011)表示されていることを確認できます。

7.次に、[適正]タブをクリックします。

00126

このタブでは、ドメイン ルールを満たしている、有効なデータを確認することができます。

8.次に、[ドメイン]で「取引先名」と選択して、[適正]タブを開きます。

00127

適正な値が 6件(dummy1~5 日本マイクロソフト株式会社)表示されていることを確認できます。

9.次に、[取引先名]の[修正済み]タブを開きます。

00128

ここでは、シノニムへ設定した間違ったデータ(マイクロソフト日本株式会社日本マイクロソフト())が、正しいデータ(日本マイクロソフト株式会社)へ修正されていることを確認できます([次に修正]列へシノニムの先頭へ設定した値が表示されていることを確認できます)。また、このタブでは、[承認]と[拒否]のどちらかを選択することで、この修正を承認するか(既定は承認)、拒否するかを設定することもできます。

確認後、[次へ]ボタンをクリックします。

10.次の[エクスポート]ページでは、クレンジング処理した結果をエクスポートするかどうかを選択することができます。

00129

出力データのプレビュー]には、クレンジング処理した結果が表示されていることを確認できます。

11.出力データのプレビュー]を次のように右側へスクロールすると、ドメイン ルールに違反した 2つのデータ(TR0333XX011)は、[取引先コード_状態]が「無効」と設定されていることを確認できます。

00130

また、シノニムを設定した間違ったデータ(マイクロソフト日本株式会社日本マイクロソフト())には、[取引先名_Output]に、正しいデータ(日本マイクロソフト株式会社)が設定されていることを確認できます。

12.次に、[クレンジング結果をエクスポートします]セクションで、[エクスポート先の種類]で「SQL Server」、[データベース名]で「DQStest」、[テーブル名]で「exp1」など任意のテーブル名を入力して、[エクスポート]ボタンをクリックします。

00131

13.エクスポートが完了すると、次のようにダイアログが表示されます。

00132

14.エクスポートが完了したら、[完了]ボタンをクリックして、データ品質プロジェクトを完了します。

00133

15.最後に、Management Studio を起動して、クエリ エディターでエクスポートされたテーブル(exp1)の中身を参照します。

USE DQStest
SELECT FROM exp1

00134

出力データのプレビュー]で確認したように、ドメイン ルールに違反した 2つのデータ(TR0333XX011)は、[取引先コード_状態]が「無効」と設定され、シノニムを設定した間違ったデータ(マイクロソフト日本株式会社日本マイクロソフト())には、[取引先名_Output]に、正しいデータ(日本マイクロソフト株式会社)が設定されていることを確認できます。このように、データ品質プロジェクトを利用すると、シノニムやドメイン ルールといったナレッジ ベースで設定したクレンジング処理が正しく動作しているかどうかを簡単に確認することできます。

目次へ | 前のページへ | 次のページへ

事例1

SQLQualityは執筆とセミナーを通じて技術の啓蒙やエンジニアの育成支援も行っています
最新刊
SQL Server 2016 の教科書
SQL Server 2016 の教科書(ソシム)

弊社オリジナル制作の
SQL Server 2016 自習書も
マイクロソフトのサイトで公開中!
ダウンロードはこちら
セミナー風景
セミナー風景

ロングセラー
ASP.NET でいってみよう  SQL Server 2000 でいってみよう
ASP.NET でいってみよう
第7刷 16,500 部発行
SQL Server 2000 でいってみよう
第12刷 28,500 部発行
SQL Server 2014 CTP2 インメモリ OLTP 機能の概要
SQL Server 2014 CTP2 インメモリ OLTP 機能の概要(Amazon Kindle 書籍)

弊社執筆の
SQL Server 2014 自習書
マイクロソフトのサイトで公開中
目次はこちら

弊社執筆の
SQL Server 2012 自習書
マイクロソフトのサイトで公開中
ダウンロードはこちら
松本美穂のコラム
(公開活動などのお知らせ)

第60回:SQL Server 2017 自習書 No.3「SQL Server 2017 Machine Learning Services」のご案内
第59回:SQL Server 2017 自習書 No.2「SQL Server 2017 on Linux」のご案内
第58回:SQL Server 2017 自習書 No.1「SQL Server 2017 新機能の概要」のご案内
第57回:SQL Server 2017 RC 版とこれまでのドキュメントのまとめ
第56回:「SQL Server 2016 への移行とアップグレードの実践」完成&公開!
第55回:書籍「SQL Server 2016の教科書 開発編」(ソシム)が発刊されました
第54回:「SQL Server 2016 プレビュー版 Reporting Services の新機能」自習書のお知らせ
第 53 回:SQL Server 2016 Reporting Services の新しくなったレポート マネージャーとモバイル レポート機能
第 52 回:SQL Server 2016 の自習書を作成しました!
第 51 回:PASS Summit と MVP Summit で進化を確信!
第 50 回:新しくなった Power BI(2.0)の自習書を作成しました!
第49 回:Excel 2016 の Power Query を使う
第 48 回:新しくなった Microsoft Power BI ! 無料版がある!!
第 47 回:「Microsoft Azure SQL Database 入門」 完成&公開!
第 46 回:Microsoft Power BI for Windows app からの Power BI サイト アクセス
第 45 回:Power Query で取得したデータを PowerPivot へ読み込む方法と PowerPivot for Excel 自習書のご紹介
第44回:「SQL Server 2014 への移行とアップグレードの実践」ドキュメントを作成しました
第43回:SQL Server 2014 インメモリ OLTP 機能の上級者向けドキュメントを作成しました
第42回:Power Query プレビュー版 と Power BI for Office 365 へのクエリ保存(共有クエリ)
第41回:「SQL Server 2014 CTP2 インメモリ OLTP 機能の概要」自習書のお知らせです
第40回: SQL Server 2012 自習書(HTML版)を掲載しました
第39回: Power BI for Office 365 プレビュー版は試されましたか?
第38回: SQL Server 2014 CTP2 の公開
第37回: SQL Server 2014 CTP1 の自習書をご覧ください
第36回: SQL Server 2014 CTP1 のクラスター化列ストア インデックスを試す
第35回: SQL Server 2014 CTP1 のインメモリ OLTP の基本操作を試す
第34回: GeoFlow for Excel 2013 のプレビュー版を試す
第33回: iPad と iPhone からの SQL Server 2012 Reporting Servicesのレポート閲覧
第32回: PASS Summit 2012 参加レポート
第31回: SQL Server 2012 Reporting Services 自習書のお知らせ
第30回: SQL Server 2012(RTM 版)の新機能 自習書をご覧ください
第29回: 書籍「SQL Server 2012の教科書 開発編」のお知らせ
第26回: SQL Server 2012 の Power View 機能のご紹介
第25回: SQL Server 2012 の Data Quality Services
第24回: SQL Server 2012 自習書のご案内と初セミナー報告
第23回: Denali CTP1 が公開されました
第22回 チューニングに王道あらず
第21回 Microsoft TechEd 2010 終了しました
第20回 Microsoft TechEd Japan 2010 今年も登壇します
第19回 SQL Server 2008 R2 RTM の 日本語版が公開されました
第18回 「SQL Azure 入門」自習書のご案内
第17回 SQL Server 2008 自習書の追加ドキュメントのお知らせ
第16回 SQL Server 2008 R2 自習書とプレビュー セミナーのお知らせ
第15回 SQL Server 2008 R2 Reporting Services と新刊のお知らせ
第14回 TechEd 2009 のご報告と SQL Server 2008 R2 について
第13回 SQL Server 2008 R2 の CTP 版が公開されました
第12回 MVP Summit 2009 in Seattle へ参加

技術コミュニティでも活動中