Pentaho Data IntegrationのSpoonでは新たなバージョンがリリースされるたびに小さな不具合の修正だけでなく毎回数多くのステップが追加されていますが、数が多すぎてどのステップがどういった働きをするのかすべてのステップの働きを把握するのは困難です。
そこで今回は便利で利用頻度の高いステップを紹介します。
・Row Normalizer
Row Normalizerステップは行で持っているデータを列のデータに変える事ができます。
例えば以下ようなテーブルにRow Normalizerを使用すると

カラムヘッダーのProduct名と行のデータのSalesが列のデータに変わります。

Pentaho Data Integrationのステップはテーブルデータを行で見て扱う事が多いので
このように列のデータを行のデータに変えなければならない事は多々あります。
・Filter Rows
Filter Rowsはその名の通りテーブルを行ごとに見て与えられた条件でフィルターを掛けます。
例えば以下のように定義すると

そこで今回は便利で利用頻度の高いステップを紹介します。
・Row Normalizer
Row Normalizerステップは行で持っているデータを列のデータに変える事ができます。
例えば以下ようなテーブルにRow Normalizerを使用すると

カラムヘッダーのProduct名と行のデータのSalesが列のデータに変わります。

Pentaho Data Integrationのステップはテーブルデータを行で見て扱う事が多いので
このように列のデータを行のデータに変えなければならない事は多々あります。
・Filter Rows
Filter Rowsはその名の通りテーブルを行ごとに見て与えられた条件でフィルターを掛けます。
例えば以下のように定義すると

インプットストリームのItemカラムがリンゴの行はTrueとなりExcel OutputステップにアウトプットされそうでなければFalseとなりDummyステップにアウトプットされます。
Filter Rowsは必要なデータを絞り込む時に最も多く使用されるステップのひとつです。
・Select Values
Select Valuesはアウトプットストリームへのフィールドの選択、フィールド名の変更、データタイプの変更などをする為のステップです。

Filter Rowsは必要なデータを絞り込む時に最も多く使用されるステップのひとつです。
・Select Values
Select Valuesはアウトプットストリームへのフィールドの選択、フィールド名の変更、データタイプの変更などをする為のステップです。

フィールドの選択タブからアウトプットストリームに使用するフィールドを選択、フィールドの削除タブからアウトプットストリームに使用しないフィールドを削除することが出来ます。
メタ情報タブからはフィールド名、データタイプ、フィールドの長さの変更をする事が出来ます。
★Have a nice Open Source Day★
KSKソリューションズ Pentahoチーム
Tweet
メタ情報タブからはフィールド名、データタイプ、フィールドの長さの変更をする事が出来ます。
★Have a nice Open Source Day★
KSKソリューションズ Pentahoチーム
コメントする