Amazon S3とPentaho Data Integrationの接続

|
今回は、Amazon S3上のCSVファイルをPDIで直接読み込む方法のご紹介です。
使用するステップは「S3 CSV Input」ステップです(Transformation内にあります)。
S3.png


設定手順ですが、まず、AWSのアクセス証明書を確認し、アクセスキーとシークレットキーを取得します。
AWS1.png


次に「S3 CSV Input」ステップを開き、以下の様な設定画面を表示します。
S3_set.png


ここで、アクセスキー/シークレットキーを入力、「Select bucket」ボタンを押下すると、キーに応じたバケットが表示されますので、選択します。
取得したいファイルも「参照」ボタンより選択し、最後にCSVの仕様に沿ったフィールド名とフィールドタイプを入力(もしくは「フィールドを取得」ボタンより取得)して完了です。

この状態で、「プレビュー」を実行すると、以下のようにS3上のCSVファイルの情報をPDIから直接取得することが可能となります。
S3_prev.png


また、S3上のファイルをコピー操作することも可能です。
こちらは、また後日、ご紹介できればと考えております。

今日のところは以上です!


★Have a nice Open Source Day★
KSKアナリティクス Pentahoチーム

2014年4月

    1 2 3 4 5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28 29 30