【連載】PDI 誌上ハンズオン - 4

|
PentahoのETL(PDI)でデータ変換を作成するハンズオンの
4回目は、データベースからデータを取得する方法をご紹介します。

本ハンズオンは、Pentaho 5.2で動作確認を行っております。

スライド79.PNG
◇事前準備

本ハンズオンでは、Postgresデータベースが必要となります。
Enterprise版では、Pentahoのリポジトリ用のデータベースがインストールされていますので、
ひとまずそちらのPostgresをご利用いただくことも可能です。
(本番環境では、別途データベースをご用意ください)

今回のサンプルデータ pagila

配布サイト

ダウンロードして解凍したファイルから、次の2つをPostgresのpsqlコマンドから実行します。
pagila-data.sql
pagila-schema.sql

スライド80.PNG
新規のデータ変換を作成し、まずはデータベース接続を追加します。
[ビュー]タブを表示し、[データベース接続]を右クリックして[新規]を選択します。


スライド81.PNG
データベース接続の各設定項目を入力します。
入力後、[テスト]ボタンをクリックして設定内容を確認します。


スライド82.PNG
[検索]ボタンをクリックすると、データベースエクスプローラーの画面が表示され、
テーブルの一覧が確認できます。

スライド83.PNG
「country」テーブルを右クリックして[最初の100行プレビュー]を選択して、
テーブルの内容を確認します。


スライド84.PNG
テーブルの内容のプレビューが表示されます。



スライド85.PNG
「テーブル入力」ステップと「テキストファイル出力」ステップをキャンバスに配置し、
ホップで接続します。


スライド86.PNG
「テーブル入力」ステップをダブルクリックして編集します。
[SQLの選択]ボタンをクリックします。


スライド87.PNG
データベースエクスプローラで「country」テーブルを選択し、[OK]ボタンをクリックします。
「フィールド名をSQLに追加しますか」とメッセージが表示されますので[はい]を選択します。



スライド88.PNG
countryテーブルを取得するSQLが生成されます。
[OK]ボタンをクリックして、「テーブル入力」ステップの編集画面を閉じます。


スライド89.PNG
「テキストファイル出力」ステップをダブルクリックして編集します。
[ファイル]タブではファイル名を指定します。
続いて[全般]タブでは区切り文字と文字コードを指定します。
区切り文字は、[タブの挿入]ボタンをクリックすると、タブ区切りを指定することができます。
文字コードは「UTF-8」を選択肢から選択します。


スライド90.PNG
[フィールド]タブを表示します。
[フィールドを取得]ボタンをクリックすると、対象テーブルの列情報が取得されます。
[OK]ボタンをクリックして、「テキストファイル出力」ステップの編集を終了します。


スライド91.PNG
ツールバーの一番左側のボタンをクリックして、データ変換を実行します。



スライド92.PNG
作成された出力ファイルをテキストエディタで開いて、内容を確認します。

次回は、データベースに対してデータを出力する方法をご紹介する予定です。

2015年11月

1 2 3 4 5 6 7
8 9 10 11 12 13 14
15 16 17 18 19 20 21
22 23 24 25 26 27 28
29 30