用語整理: Slowly Changing Dimensions

| | コメント(0) | トラックバック(0)

ビジネスインテリジェンス学習を進めると様々なjargonに出くわします。

そこで、理解できたところを少しずつ整理して行ければと思います。

何かお気づきの点がありましたらご指摘いただけますと幸いです。


まずは、Slowly Changing Dimensionsについて。


Slowly Changing Dimensionsはデータウェアハウスを構築する上で直面するディメンショナルデータの更新に対する考え方で、下記の6つのタイプに分類される。ラルフキンボールさんにより90年台前半に導入され、その後、データベースモデリングコミュニティの方々により改良されている。


タイプ1:Overwrite the Value

  • タイプ1は単に古い属性値を新しい値と置き換え、常に最新の情報を反映する一番シンプルな方法
  • ファクトテーブルは変更なし
  • 長所は速く、簡単な仕組みであり、短所は履歴が残らないこと


タイプ2:Add a Dimension Row

  • 履歴をしっかり残すための方法。
  • ファクトテーブルは、行を遡って編集せず、新たなサロゲートキーで行を挿入する
  • ナチュラルキーが別個に保存された同一アイテムをつなぐ。
  • アイテム数をカウントする時はナチュラルキーを使用する
  • 新たに挿入されたディメンションテーブルの行はファクトテーブルにも区画される
  • ファクトを参照する際に有効なサロゲートキーを識別するためにステージングエリアでは有効期間の属性が必要
  • 時間軸を用いて分析する際に頼れる方法
  • 短所は、行が増殖するのでテーブルが大きくなるのが速いこと

変更前

type2_before.jpeg


変更後

type2_after.jpeg


セールスファクト

type2_fact.jpeg



タイプ3:Add a Dimension Column

  • 新たな行を生成せず、新たなカラムで属性の変更を捉える方法。
  • 一つ前の情報を保持するためのカラムを持つ
  • タイプ2と異なる点は、現在と以前の値が共に有効と見なせる点。
  • 履歴を辿る必要がある場合は使えない。

変更前

type3_before.jpeg


変更後

type3_after.jpeg



タイプ4:Mini Dimensions

  • ディメンションテーブルが、1億行を超えるといった、大きくなりすぎる場合や、更新頻度が高く年間に行数が2倍、3倍と膨れ上がる場合に用いる。
  • 更新頻度に応じてグループ分けし、複数のディメンションテーブルに分離する。
  • ファクトテーブルに分離したテーブルのディメンションキーを追加する。
type4.jpeg

customerディメンションから変更頻度の異なるgeography属性とdemography属性を分離



タイプ5:Separate History Table

  • ディメンションテーブルの各属性の変更を正確に捉えることを目的とした履歴用テーブル
  • あるトランザクション時にどのレコードが有効だったかを特定することを可能にする
  • 他のタイプと併用して用いられる
  • ファクトテーブルを参照する分析には用いない
  • ファクトテーブルと同様の性質を持つが、保持するのはファクトではない
  • アイテム数や変更回数をカウントすることでアクティビティを分析することが出来る
  • 他用途多数
type5.jpeg type5.jpeg

タイプ5のテーブルと親ディメンションテーブルの例



タイプ6:Hybrid Techniques

  • タイプ1から3を混ぜたハイブリッドな方法(1+2+3=6)
  • タイプ3の一つ前の情報を保持するカラムを用いて、タイプ2で変更を捉え、さらに変更を加える場合はタイプ1で行う

変更前

type6_before.jpeg


変更後

type6_after.jpeg


さらに変更後

type6_and_after.jpeg


Pentaho Data Integrationのステップ:

  • Insert / Updateはタイプ1に、
  • Dimension lookup/updateはタイプ1、タイプ2にそれぞれ対応したステップ
  • その他のタイプは上記2つを筆頭にその他のステップを用いて行う事ができる


出典:

トラックバック(0)

このブログ記事を参照しているブログ一覧: 用語整理: Slowly Changing Dimensions

このブログ記事に対するトラックバックURL: http://www.pentaho-partner.jp/mt/mt-tb.cgi/296

コメントする

2014年4月

    1 2 3 4 5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28 29 30