Amazon S3とPentaho Data Integrationの接続(ファイルコピー編)

|
おはようございます。
今日は、以前書くと言っていた、Amazon S3とPentahoDataIntegrationの接続(コピー編)です。
PDIから簡単にS3上へファイルをコピーしたり、S3からローカルへコピーしたりする機能のご紹介です。
それではさっそく。

使用する機能は、「Hadoop Copy Files」ステップです(JOBの中で使用できます)。
S3Copy1.png

ステップを開くと、以下の様な設定画面(左のイメージ)が出てきますので、参照元のファイルとディレクトリ」の右の方にある「Browse」ボタンをClickします。
すると、ファイル取得用のウィンドウが新たに表示されます(右のイメージ)。
そこで、Look Inを「S3」に、アクセスキーとシークレットキーを入力し、「Connect」ボタンをClick、コピー対象のファイルかディレクトリ(バケット)を選択、「OK」ボタンをClickします。
S3Copy2-3.png

同じように「移動先のファイルとディレクトリ」も「Browse」ボタンより設定し、最後に「OK」ボタンをClickすると、以下のように設定が反映されます(左のイメージ)。
設定に問題がなければ「追加」ボタンのClick、「OK」ボタンをClickして、設定完了です(右のイメージ)。
S3Copy4-5.png

ファイル単体でのコピーや、ディレクトリを指定しての再帰的なコピーももちろん可能ですし、正規表現を使用することも可能です。
ぜひお試しください。
※イメージが小さくて見づらかったです。申し訳ございません。Clickすると大きくなります。


★Have a nice Open Source Day★
KSKアナリティクス Pentahoチーム

2014年4月

    1 2 3 4 5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28 29 30