PDIのステップについて

| | コメント(0) | トラックバック(0)
Pentaho Data IntegrationのSpoonでは新たなバージョンがリリースされるたびに小さな不具合の修正だけでなく毎回数多くのステップが追加されていますが、数が多すぎてどのステップがどういった働きをするのかすべてのステップの働きを把握するのは困難です。
そこで今回は便利で利用頻度の高いステップを紹介します。

・Row Normalizer
Row Normalizerステップは行で持っているデータを列のデータに変える事ができます。
例えば以下ようなテーブルにRow Normalizerを使用すると
横持ちデータ.jpg

カラムヘッダーのProduct名と行のデータのSalesが列のデータに変わります。
縦持ちデータ.jpg
Pentaho Data Integrationのステップはテーブルデータを行で見て扱う事が多いので
このように列のデータを行のデータに変えなければならない事は多々あります。

・Filter Rows
Filter Rowsはその名の通りテーブルを行ごとに見て与えられた条件でフィルターを掛けます。
例えば以下のように定義すると
フィルターロー.jpg
インプットストリームのItemカラムがリンゴの行はTrueとなりExcel OutputステップにアウトプットされそうでなければFalseとなりDummyステップにアウトプットされます。
Filter Rowsは必要なデータを絞り込む時に最も多く使用されるステップのひとつです。

・Select Values
Select Valuesはアウトプットストリームへのフィールドの選択、フィールド名の変更、データタイプの変更などをする為のステップです。
selectvalue.jpg
フィールドの選択タブからアウトプットストリームに使用するフィールドを選択、フィールドの削除タブからアウトプットストリームに使用しないフィールドを削除することが出来ます。
メタ情報タブからはフィールド名、データタイプ、フィールドの長さの変更をする事が出来ます。

★Have a nice Open Source Day★
KSKソリューションズ Pentahoチーム

トラックバック(0)

このブログ記事を参照しているブログ一覧: PDIのステップについて

このブログ記事に対するトラックバックURL: http://www.pentaho-partner.jp/mt/mt-tb.cgi/73

コメントする