Amazon RedshiftとPentaho Data Integrationの接続

|
Pentahoが持つETLツール(PDI)がAmazon Redshiftと接続可能であることは、いろいろなところでご紹介させていただいていたり、また各所で事例も出ているかと思います。

ただ、本ブログにおいては接続手順をご紹介していなかったと思いましたので、イメージを交えて載せておきたいと思います。
それではさっそく。


Redshiftのコンソールです。Redshiftを起動すると以下のようにStatusがavailableとなっています。
redshift-console1.png

上のイメージにあるとおり、Clusterの「demo」をクリックすると、接続情報が表示されます。
以下の様なイメージです(一部マスクしています)。
redshift-console2.png

PDI(Spoon)のDatabaseConnection作成画面にて、Redshiftの接続情報を設定します。
pdi_setting1.png

テストボタンを押下して、以下のとおり接続できていればOKです。
pdi_setting2.png

コネクションさえ作成できれば、あとは、通常の「Tableインプット」ステップにてSQLを実行しデータを取得することが可能です。
pdi_setting3.png


RedshiftはPostgreSQLベースということもあり、JDBCドライバはPostgreSQLと同じものを使用します。
ドライバが見つからないとのエラーが出た場合は、PostgreSQL用のJDBCドライバを追加してお試しください。

Redshiftさえ準備出来ていれば、PDI側は特別な設定も必要ありませんので、とても簡単にご使用いただくことが可能です。
必要に応じ、お試しください。
もし、不明点等ございましたら、こちらからお問い合わせください


★Have a nice Open Source Day★
KSKアナリティクス Pentahoチーム

2014年4月

    1 2 3 4 5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28 29 30