2010年4月アーカイブ

PDIでは、作成したジョブやトランスフォーメーションを
GUIからの操作ではなく、当然コマンドラインから実行できますが、

引数を指定したい場合の簡単な例を以下に記します。
(テーブルから取得したデータをテキストファイルに出力するだけ)

01.jpg

・Get System Info
02.jpg

「command line argument 1」を指定。
フィールド名は任意文字列。

・Table input
03.jpg

「先行のステップから値を引き続ぐ」にチェック。
データを取得するSQL文の
引数の値をセットしたい部分に「?」と記載。

・コマンドラインから実行

今回のはTransformationなのでPanを使用する。
もちろんJobであれば、Kitchenを使って同じようにできます。

>Pan /file (ktrファイル名) (引数の値)04.jpg

実際発行されるSQLは以下のようになり

SELECT * from
 dim_q1
where id = 1   ←引数で設定した値
order by id

該当するレコードがテキスト出力されます。


★Have a nice Open Source Day★
KSKソリューションズ Pentahoチーム









桜も散り、ようやく春らしい陽気を感じられるようになってきました。Pnetaho News 4月号です。

(1)Pentaho Agile BI発表
4月1日にPentaho Agile BIが発表されました。Pentaho Agile BIイニシアティブの一部として、Pentaho Data Integration4.0(PDI4.0)がリリースされました。

PDI4.0は、ETLツール(Spoon)に「パースペクティブ」の概念をもたらします。PDI4.0は、ETL、レポート、OLAP、メタデータのデザイン環境が統合され、エンドユーザーのビジュアライゼーションを含む、BIソリューション作成におけるすべてのタスクを提供します。
ビジネスユーザーは、SQLやMDXについての知識がなくても、すぐにデータと接続してレポートを構築でき、単純なクリック操作でBIソリューションを構築できます。

4月7日から4週に渡り、「Pentaho Data Integration 4.0 and Agile BI - Techcast Series」として、ビデオが公開されます。是非ご覧ください。

お問い合わせや体験版の入手については弊社お問い合わせ窓口からお問い合わせください。


(2)オープントレーニング、セミナーまだまだ募集中
5月に予定しております、オープントレーニング、セミナーはまだ空席がございます。オープントレーニングについては、空席がわずかとなっておりますのでお早めにお願いします。

●Pentahoオープントレーニング
日時:5月11日(火)~12日(水) 10:00~18:00
場所:東京会場 ARI Flap stageセミナールーム http://www.vsn.jp/afs/access.html
詳 しくは、こちらをご覧ください。

●Pentahoセミナー
日時:5月26日(水) 14:00~16:00
場所:東京会場 品川イーストワンタワー http://www.e-onetower.com/access/index.html
詳しくは、こちらをご覧ください。

オープントレーニング、セミナーともにPentaho最新日本語版3.5.2で行いますので、是非、ご参加お願い申し上げます。


(3)Pentaho日本語スタートキット バージョン3.5.2
バージョン3.5.0から最新版のバージョン3.5.2にアップしました。詳しくはこちらをご覧下さい。


★Have a nice Open Source Day★
KSKソリューションズ Pentahoチーム
今回は営業現場でよく聞くBIツール比較のお話です。

単機能か統合BIか
BI導入と言っても当初は定型レポートのみだったり、データを統合するところから始めるのが一般的。このためツールもまずは単機能でよいと考える方も多くて当然です。
ただ、単機能から順次導入すると後から大きな追加投資が必要にならないか注意しましょう。
BIの真価を発揮するならETLから定型レポート、自由検索、多次元分析、ダッシュボードが必須になるのではないでしょうか?

"Think Big, Start Small, Move Fast"がBIの原則ですので、当初は部門用途で個別単機能のみでもすべてを活用して全社展開することを前提とするのがお勧めです。

機能比較表
各社の製品名を並べて○×表を一生懸命作成されるケースを見受けますが、
項目設定は本当にユーザーニーズを反映したものでしょうか?
実績ある市販のBIツールはどれも十分な機能を既に持っており、多すぎてよくわからない位です。
○×表に時間をかけるならば、プロトタイプを作成するのがよいと思います。
(ご要望に対応するため当社も○×表をご提供してはおります)

グローバルな製品か日本固有の製品か
とても古い話ですが、パソコンといえばPC98という時代がありました。
現在は皆さん世界標準機を使っています。
携帯電話も日本の独自仕様が繁栄してきましたが今やガラパゴスと呼ばれ、
グローバルなiphoneやandroidがシェアを伸ばしつつあります。
ビジネスソフトウェアの世界も同様で、確かに日本独自のBI製品は日本人に合っている部分もあるのですが、オープンでユーザーの多いグローバルスタンダードが主流になるのではないでしょうか?
pentaho-iphone.JPG


営業色が強めのお話になってしまいましたが、ご参考になれば幸いです。
★Have a Nice BI Implementation★
KSKソリューションズ Pentahoチーム 


前回の投稿でPDIのステップの一部を紹介しましたが今回も引き続きいくつかのステップを紹介したいと思います。

・Switch/Case
Javaなどのプログラム言語で使用されているswitch/caseオブジェクトの様なステップです。
switch/caseを使用すると、指定した値を持つ行を指定したステップにアウトプットする事が出来ます。
switch-case.jpg
例えば上のように設定するとclassroom_idフィールドに1の値を持った行はDummy(do nothing)ステップへ、2の値を持った行はDummy(do nothing)2ステップへ、その他の行はDummy(do nothing)3ステップへアウトプットされます。

・Combination Lookup
Combination Lookupステップは指定したテーブルにキーフィールドを作成する事が出来ます。
combination_lookup.jpg
上のように設定し、右下のSQLボタンを押すとsubjectsテーブルにsubject_idカラムが作成されます。トランスフォーメーシあうョンを実行するとsubject_nameの行数だけsubject_idカラムに1から順に値が入ります。作成されたsubjectsテーブルは以下の通りです。
subject_table.jpg

・Dummy Step
Dummy Stepは何もしません。何もしませんが主にテスト目的で使用され、最も使用するステップのひとつだと言えます。
例えば以下のようなトランスフォーメーションを定義した場合、実際にはデータストリームをDBにアウトプットしたいが動作確認の為Dummyステップを使用すると言った使い方が出来ます。
dummy.jpg
またこのトランスフォーメーションではFilter Rowsステップでtrueの値のみをDBに入れたいので行き場のない必要の無いデータをDummyステップに投げています。

★Have a nice Open Source Day★
KSKソリューションズ Pentahoチーム

と聞かれることが時々あります。というのも、「オープンソース」 = 「コミュニティ組織」 = 「ボランティアの開発者たちの集まり」、といったことを連想されるためです。

Pentahoは、2004年に米国フロリダのオーランドで設立された株式会社(Pentaho Corporation)です。ビジネスオブジェクツ、コグノス、ハイペリオン、Jboss、Oracle、SAS等の商用BIベンダー出身者と、Kettle(ETL)、Mondrian(OLAP)、JfreeReports(レポート)等のオープンソースPJのアーキテクトたちが集まり、2005年にバージョン1がリリースされました。2010年、Pentahoはバージョン4となり、BI商用製品を凌駕する品質・機能を備えるまでになっています。

Pentahoは、2つの顔を持っています。「営利企業」の顔と「オープンソースコミュニティ」としての顔です。

 

  • 「営利企業」(pentaho.com)としてのPentaho:

Pentahoは利益を追求する株式会社です。ベンチャーキャピタルからも多く出資を受け、企業としても注目されています。最近も4thラウンドでの7億円の増資を受け、合計約30億円の資本を有しています。 R&Dに多額の投資を行い、商用版に匹敵する機能を短期間で開発しています。 導入企業はワールドワイドで8000社を超えました。

 

  • 「オープンソースコミュニティ」(pentaho.org)としてのPentaho:

Pentahoは、ソースコードをコミュニティに公開するオープンソース・プロジェクトです。GPL(LGPL)ライセンスの元で配布されています。このノーガード戦法とも言えるオープン性は、下記のようなベネフィットを提供します。

ユーザーに対して、低コストでBIシステムを構築できる(商用BIツールは特に高い)、特定のベンダーによるロックインから逃れられる。

開発者に対して、Pentahoに対応するプラグインや付加機能の開発の誘引となる。(BIは特にカバーすべき範囲が広い)、コミュニティが活性化し、その中でナレッジや機能要望などが洗練されていく。(Pentahoファンの増加)

Pentahoにとって、多額の広告宣伝費を投じなくても、ターゲットとなるユーザーが自らダウンロードし、評価してくれる。他のJava系のオープンソースを組み入れることで開発がスピードアップする。

 

  •  Pentahoの人々:

上記のような2つを顔を持ち、Pentahoメンバーも「商用BIベンダー出身者」と「OSSコミュニティ出身者」に分かれるため、Pentahoの社内カルチャーはハイブリッドなものです。弊社もセールス面、技術面でPentahoとやり取りを行いますが、ある技術者が入社時のこんなジョークを教えてくれました。

 

トーマス・・・Pentahoレポーティングのチーフ開発者・Jfreeレポートの創始者

カーティス・・・レポートデザイナー3.5の開発者・ハイペリオン出身

 

トーマス:「Kurtis、今度君には新しいレポートデザイナー3.5の開発を担当してもらうよ。

       じゃあ、これについてミーティングを始めよう。まずeclipse(エクリプス)を起動してくれ。」

カーティス:「eclipse(エクリプス)って、何ですか?」

トーマス:「Ohhh」

 

 ハイペリオン出身の彼はオープンソースとはまったく無縁の生活を送っていたので、戸惑うことが多かったそうです。ただこうした異質なバックグランドを持つ人たちの集まりは、Pentahoのコンピタンスの一つとなっているのは間違いありません。

 

 参考:Pentahoを作っている人たちです。Pentahoの社長(Richard)はじめ、ほぼオールキャストで出演です。

 

 

 

analyzerレポートやJpivotなどで
実際どのようなSQLやMDXが発行されているか見たい場合。

log4j設定ファイルを変更することで可能です。
/biserver-ee/tomcat/webapps/pentaho/WEB-INF/classes/log4j.xml
を開き
ファイルの末尾付近

・Special Log File specifically for Mondrian
  →Mondrian全体のlog

・Special Log File specifically for Mondrian MDX Statements
 →MDXのlog

・Special Log File specifically for Mondrian SQL Statements
 →SQLのlog

全てデフォルトではコメントアウトされているので
そのコメントを外して再起動すれば
指定したフォルダにlogが出力されるようになります。




"データベース製品は何がよいでしょうか?"というご質問を頂くことがあります。
BIツールから見ると、背後で動くデータベースのパフォーマンスはとても重要です。

定番製品
一昔前ならリレーショナルデータベースといえばOracle,DB2,Sybase,Informix,SQLServerでしょうか?
オープンソース系ではMySQLとPostgresSQLが2大ブランドです。
InformixはIBM傘下となり、OracleがSunの元にあったMySQLを手に入れるなど再編もありますが、
最近はDWHに特化した新興勢力が多く出てきて選択肢が増えました。

逆に既にDWHを構築されているお客様には、何をご利用になっているかをお伺いします。
データ量がファクトテーブルで数十万件程度であれば、MySQLやOracleといった従来のRDBMSである程度のレスポンスが出ますし、定番DB製品として実績も多くあります。

大容量なら
本格的な情報活用を目指すBIシステムになりますと、大容量で高速レスポンスが必要となります。
データベース製品もDWH/BIに特化したものが有効となり、Teradata,Oracle Exadata,Netezzaといったアプライアンスを利用されているお客様が増えます。
また、注目株は低価格なオープンソース系でカラムベースにより高速検索を実現しているInfoBrightやLucidDB,MonetDBといった製品です。
実際に弊社でも一千万件のパフォーマンス測定をしてみましたが、期待に違わぬ数値を出しました。

BIツールの対応
Pentahoは上記すべてを含む多くのDB製品を標準接続対象としていますので、
現在ご利用中の製品から最新テクノロジー製品まで幅広くご利用いただくことができます。

ETLも含まれるオールインワンですので、最新技術を利用した高速DB製品のテストにも最適です。

dbs.JPG

ご質問などありましたら、お気軽にKSKソリューションズまでご連絡下さい。
★Have a Nice BI Implementation★
KSKソリューションズ Pentahoチーム  

付記:
KSKソリューションズではPentahoエンタープライズエディションのサポートを実施しており、
各データベースの詳細につきましてはご購入元のDBベンダー、代理店様やSIer様にご相談下さい。

2014年4月

    1 2 3 4 5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28 29 30