2013年8月アーカイブ

Pentahoエディションの違い

|
今週はずいぶん涼しくなってきました。季節の移り変わりを感じます。

今回はPentaho(エンタープライズ版=有償サポート版)の3つのエディションの違いをご紹介します。

Pentahoをご契約、お支払頂くと、1年間有効なライセンスキーファイルが提供されます。
最上位のエンタープライズでは以下の7つのファイル構成となります。
licensekey1.jpg
中位のプロフェッショナルでは、Hadoopが提供されず、6ファイルとなります。
下位のベーシックでは、BI PlatformとDashboard,PDIの3ファイルとなります。

これらのファイルを下記のように適用します。
licensekey2.jpg

適用方法はマニュアルやこちらの別記事を参照下さい。

ベーシックとプロフェッショナルの機能差はPUC(Pentahoユーザーコンソール:ブラウザでログインしてレポート操作する画面)では以下となります。
licensekey3.jpg

この違いは大きく、ドラックアンドドロップでレポートを操作する2つの主要機能はプロフェッショナル以上で使用できることになります。 (ベーシックでは無償版と同等)

以下のレポートは分析レポートで作成したものです。
pentaho-olap2.jpg

エンタープライズではプロフェッショナルに加えて、HadoopノードにPentahoのモジュールが設置されジョブ作成/実行制御などが可能となります。

ベーシックとプロフェッショナルでは使い勝手に差があるため、ほとんどのお客様がプロフェッショナルのご契約となっています。

機能差の概要は以上ですが使用可能コア数やサポートレベルなどにも違いがありますので、詳細はお問い合わせ下さい。

★Have a nice Pentaho edition★
KSK Analytics Pentaho Team

ETLで統計情報を取得する

|
昨日は、ETL処理の中ではあまり光の当たらないSampleステップをご紹介しましたが、今日は、統計情報を取得するステップをご紹介したいと思います。
こんなステップもあるのだなと思っていただければとても嬉しいです。

ということで、さっそくですが、以下の様なトランスフォーメーションを作成してみました。
pdi_statistics_1.png
Statisticsステップが統計情報を取得するステップです。
フィールドと取得したい統計情報を選択するだけの簡単操作となっております。

例えば、DataGridステップから以下のようなデータが流れてくるとします。
pdi_statistics_2.png

統計情報として以下のように設定すると、、
pdi_statistics_3.png

以下の様な結果を取得することができます。
Trueとした項目が取得できるイメージです。
pdi_statistics_4.png

必要に応じ、お試しいただければ幸いです。
それでは、簡単ですが、本日は以上です!


★Have a nice Open Source Day★
KSK Analytics Pentaho Team

Sampleステップの話

|
お盆です。

今日は、ETL処理ではあまり使用しない感のあるSampleステップに光をあててみたいと思います。

というわけで以下の2つです。
★Sample rowsステップ
★Reservoir Samplingステップ


こんなサンプルを作成してみました。
sample_step_sample.png

サンプルも置いておきます。
sample_step_sampe.ktr


「Sample rowsステップ」は、アイコンからも分かるように、範囲を指定してサンプルを取得します。
中身はこんな感じです。
sample_rows.png

行範囲には、取得対象のデータ範囲を入力します。
1..10ですと、1~10の範囲でサンプルを取得し、またカンマで区切ることができます。
行番号フィールドに設定したフィールドには、取得してきたデータの行番号を入れてくれます。


「Reservoir Samplingステップ」は、サンプル数とRandomSeedを与えることで、サンプルを取得することが可能です。
中身はこんな感じです。
reservoir_sampling.png

RandamSeedを固定することで、同じサンプルを取得することができます。


このように、サンプルを取得するステップもあらかじめ準備されていますので、必要に応じご使用いただければと思います。
それでは。

★Have a nice Open Source Day★
KSK Analytics Pentaho Team



皆様はYouTubeをどのように利用されていますでしょうか?

今回はPentaho社が提供しているコンテンツをご紹介致します。

例えば以下はHadoop連携の話を5分程度にまとめたものです。

YouTubeは話している言葉から自動字幕をつける機能やさらに翻訳する機能も追加されていますので、IT系ビジネス英会話学習のコンテンツとしても実践的でよいと思います。
よろしければぜひチャネル登録してご参照下さい。

★Enjoy Pentaho YouTube contents★
KSK Analytics Pentaho Team

製品紹介セミナー開催

|
弊社東京オフィスのある品川では今朝局所的に非常に強い雨が20分ほど降りました。
この季節、いつどこで集中豪雨があるか予想がつきませんネ。

そんな日の午後ですが、ご好評頂いている製品紹介セミナーを開催させて頂きました。
seminar20130806P.jpg

弊社セミナーの会場は駅直結でアクセスよく、雨に濡れる心配がありません。
国際会議規格に合致する照明や設備を備えて快適ですので、まだ未参加の方はぜひお申込み下さい。(次回日程は確定次第ホームページにてお知らせ致します)

★Please join and enjoy our seminar★
KSK Analytics Pentaho Team

アナライザーレポートの定義体として使用するスキーマは複数のディメンジョンとメジャーにより構成されますが、ディメンジョンのタイプにはスタンダードディメンジョンとタイムディメンジョンのいずれかを選択する必要があります。
基本的には日付に関するデータをタイムディメンジョンとして定義し、それ以外のデータをスタンダードディメンジョンとして定義します。

アナライザーレポートでタイムディメンジョンのフィールドに対してフィルターを設定すると以下の画像のようにタイムディメンジョン用のフィルター設定画面が表示され、時間データ専用のフィルターを設定する事が出来るようになります。
time_filter.png

例えば上記の画像のようにCurrent Yearsのフィルターを設定したレポートを保存しておくと、レポートを実行した年のデータのみが表示されるようになります。
this_year.png

スキーマにタイムディメンジョンを定義する際にはスキーマワークベンチを使用します。
アナライザーレポートにタイムディメンジョンを認識させるにはディメンジョンタイプに"TimeDimension"を指定するのに加え、各レベルにAnnotationオブジェクトを定義する必要があります。
time_dim_definition.png

英語のサイトとなりますが、詳しいAnnotationの説明が以下のページに記載されているのでよろしければご覧ください。

★Have a nice Open Source Day★
KSK Analytics Pentaho Team

日本語フォント

|
Pentahoを使う場合、CentOSをサーバーにする方も多いと思います。
CentOSに限らずフリーのLinuxサーバーの場合、日本語フォントはどうされているでしょうか? 

MSゴシック、MS明朝は版権の関係で別途購入が必要になりますので、フリーでダウンロード入手できる"さざなみフォント"や"IPAフォント"を使うのが一般的です。
IPAは情報処理試験でおなじみの国の機関でありOSSも推進されています。フォントとして高品位なのもよいですね。こちらからダウンロードできます。

レポート開発用のクライアントPCはWindowsの場合も多いので、ダウンロードしたフォントをサーバーだけでなくクライアントのC:¥Windows\Fontsにも入れましょう。
font.jpg

下のスクリーンはReportDesignerでIPAフォントを指定している例です。
ReportDesignerIPAfont.jpg
インタラクティブレポートもテンプレートでこのフォントに設定するのもよいでしょう。

文字化けが発生する場合、原因のほとんどはPentahoコアでなく、エンコード、
フォントなどの環境設定です。

こちらなども参照の上、解決しない場合は弊社正規サポート窓口へお問い合わせ下
さい。

★Have a good design report using Pentaho★
KSK Analytics Pentaho Team

2014年4月

    1 2 3 4 5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28 29 30