Pentaho Analysisの最近のブログ記事

Pentahoエンタープライズ版の機能であるアナライザーレポート機能を使うと複雑なレポートが簡単に作成できます。作成したレポートは、グラフで見たり、保存して他のメンバーと共有したり、ExcelやPDF等にエクスポートしたりすることができます。実際にPentahoデモサイトで作成してみましょう!

ana11.jpgのサムネール画像ana3-3.jpgのサムネール画像
Pentahoが分析するデータ・ウェアハウスへの接続は、JDBC、ODBCで行います。
データ・ウェアハウスを構築するデータベースの性能がパワフルで高速であればあるほど、大量データの分析や複雑な分析が可能となってきますので、データベースの選択は非常に重要になってきます。

今回は、分析アプリケーションやデータ・ウェアハウスに最適なハイパフォーマンスデータベース、Infobrightをご紹介いたします。
Infobrightの大きな特徴の2つを以下に記載します。

・列指向データベースとナレッジグリッドアーキテクチャー

Infobrightのテクノロジーは、分析ニーズに理想的なソリューションを提供するために列指向データベースとナレッジグリッドアーキテクチャーを組み合わせます。他のデータベース製品はインデックスを作成、データを分割、物理データ構造を構築といった手間を必要としますが、Infobrightの自己管理ソリューションはこういった手間を省き、複雑なクエリーに対して素早いレスポンスを返します。

・データ圧縮

他のデータベース製品は高いパフォーマンスと拡張性を提供するために、複雑で高価なハードウェアインフラストラクチャーを必要としますが、Infobrightソリューションは一つのサーバーで50TBまで拡張でき、業界最高のデータ圧縮(10:1~最大40:1)でストレージ使用率を大きく抑えます。

処理速度が非常に早い、かつ、データ圧縮による使用率拡大、低コスト。
Infobrightは、まさにこれから求められるデータ・ウェアハウス向けのデータベースと言えるでしょう。
Infobrightの詳しい内容やお問い合わせはこちらから

★Have a nice Open Source Day★
KSKソリューションズ Pentahoチーム
PentahoはiPadでのレポート閲覧やPentahoアナライザー(以下動画)による自由検索に、BIベンダーとしていち早く対応致しました。これにより、iPadの高いユーザビリティとヴィジュアル性を活かしたBIコンテンツの提供が可能となります。


特徴

  • 新たな分析レポートの作成
  • 既存のアナライザーレポートの閲覧
  • インタラクティブなドラッグ&ドロップの分析
  • リッチなチャートによるビジュアル化
  • ソートやフィルターの追加、関数の追加
  • アナライザーレポートの保存や共有
  • 元に戻す、初期状態に戻す機能
  • PDF、Excel、CSVへのエクスポート

必要環境:

  • Pentaho BI Suite エンタープライズ版 3.6
  • Apple iPad





★Have a nice Open Source Day★
KSKソリューションズ Pentahoチーム
analyzerレポートやJpivotなどで
実際どのようなSQLやMDXが発行されているか見たい場合。

log4j設定ファイルを変更することで可能です。
/biserver-ee/tomcat/webapps/pentaho/WEB-INF/classes/log4j.xml
を開き
ファイルの末尾付近

・Special Log File specifically for Mondrian
  →Mondrian全体のlog

・Special Log File specifically for Mondrian MDX Statements
 →MDXのlog

・Special Log File specifically for Mondrian SQL Statements
 →SQLのlog

全てデフォルトではコメントアウトされているので
そのコメントを外して再起動すれば
指定したフォルダにlogが出力されるようになります。




アナリシスビュー(JPivot)にて

001.jpg

上記のような情報で、

例えば、2009年度のもののみ参照したい場合は、
OLAP Navigatorより
002.jpg

とすれば

003.jpg

当然、このように見えます。

が、
この年度を変更してみる操作で
OLAP Navigatorを毎回開いて、クリックして・・・
がめんどくさい。
いつもやる操作なんだから何かいい方法はないか。
そんなときは
デザインスタジオを使用し「プロンプトから選択する」
(今回の例では年度のみ選択)
というような設定ができます。

まず、
上記の2009年度の情報を表示した状態のものを保存します。
006.jpg

保存したフォルダには
007.jpg

xactionという拡張子で保存されてます。

これを

デザインスタジオで開いて編集します。
(日本語がある場合はUTF8設定にすること)


INPUT情報である年度(year)を作成します。

008.jpg


Process Action:Relational にて
年度リストをDBより取得する
(この場合はtimeディメンジョンテーブルにあるyearを取得)

009.jpg


Process Action:Promptにて
プロンプトの表示設定
(上記で取得してyear_listを指定)

010.jpg


プロンプトで指定された値(year)をMDXクエリに渡す
(year変数をセット)


もともと2009年度を表示していたMDXクエリ
---------------------------------------------------------------------------------------------------------
select NON EMPTY {[Measures].[予算], [Measures].[実績]} ON COLUMNS,
  NON EMPTY {[ymd].[all].[2009], [ymd].[all].[2009].Children} ON ROWS
from [forBlog1]
---------------------------------------------------------------------------------------------------------
これを

↓↓↓↓↓

プロンプトで選択されるINPUT情報を変数として設定
{year}の形でセットする。
---------------------------------------------------------------------------------------------------------
select NON EMPTY {[Measures].[予算], [Measures].[実績]} ON COLUMNS,
  NON EMPTY {[ymd].[all].[{year}], [ymd].[all].[{year}].Children} ON ROWS
from [forBlog1]
---------------------------------------------------------------------------------------------------------

011.jpg


このように設定したxactionファイルを
ユーザコンソールより起動すると

012.jpg

このようにプロンプト画面となり
年度を選択することで

005.jpg

とか

003.jpg

のように

切り替えて表示できるようになります。



MDXクエリを編集することでできるちょっとした小技をご紹介します。


jpivot01.jpg

上記のようなビューで
Measuresに「達成率(実績/予算)」を追加し
値によって色分けをしたい場合、

jpivot02.jpg
MDXクエリエディタを開いて

--------------------------------------------------------------------------
with member [Measures].[達成率] as
        '([Measures].[実績] / [Measures].[予算])',
        format_string = IIf(
                    (([Measures].[実績] / [Measures].[予算]) <= 0.3),
                    "|0.000|style=red",
                    IIf(
                        (([Measures].[実績] / [Measures].[予算]) > 1.0),
                        "|0.000|style=lightblue",
                        "0.000"
                    )
                )
select NON EMPTY {[Measures].[予算], [Measures].[実績]} ON COLUMNS,
  NON EMPTY {[年月日].[全て].[2010], [年月日].[全て].[2010].[1], [年月日].[全て].[2010].[2], [年月日].[全て].[2010].[3], [年月日].[全て].[2010].[4]} ON ROWS
from [forBlog1]
--------------------------------------------------------------------------
【解説】
with member で「達成率」(実績/予算)のmeasuresを追加
format_stringにて条件や背景色を指定

のように編集し

jpivot03.jpg

新たに追加された「達成率」を表示するようにチェックすれば
こんな感じで表示されます。
(100%以上は水色、30%以下は赤色)

jpivot04.jpg


styleをarrow(=up or down)にすると
(100%以上は上向き矢印、30%以下は下向き矢印)

jpivot05.jpg

みたいなこともできます。


先日の記事でのpentaho V3.5のご紹介の通り
Pentahoエンタープライズ版の「アナライザーレポート」がかなり使い勝手がいい感じなため
以前のJPivot(アナリシスビュー)は今後あまり使われなくなるのかもしれませんが、参考までに。


★Have a nice Open Source Day★
KSKソリューションズ Pentahoチーム

BI(ビジネスインテリジェンス)のプロジェクトで弊社もよく遭遇する問題は、お客様も明確なアウトプットイメージ(どんなダッシュボードを構築したらいいのか、どんなキューブを作ればいいのかetc)を持っておられないことが多いことです。

業務システムと違い、BIの場合は設計仕様をしっかり決めることは、難しいものです、なぜなら、「どのように分析すれば成果が上がるか」というものは、やってみなければ分からないからです。良くテンプレートを活用するということも話題に上がります。しかし、一般的なテンプレートはプロジェクト初期段階においてイメージを持つためには効果はあるものの、それが自社にとって最適なものとは限りません。

結局、BIだけでなくマネジメント全般に言えることかもしれませんが、計画する→試す→検証する→再度計画する、のプロセスが重要になります。

一方で、一般的に商用BIツールは非常に高い買い物です。ちょっと試すには、慎重を重ねた検討とリスクを受け入れる勇気が必要となります。その点、オープンソースBI「Pentaho」は、低価格と高機能を併せ持つツールです。有償版であってもソフトウェアを購入する必要はなく年間サポート費用ですべて機能が使用できます。(少し営業臭くなり申し訳ありません)

さらに来年Pentahoは、BIでより成果を出すために、これらを進化させます。
来年のPentahoのテーマは、「アジャイルBI (Agile BI)」です!

1、アジャイルBIとは?
ビジネスインテリジェンス構築のための、迅速かつ軽量、反復的な開発アプローチです。
ソフトウェアアジャイル開発手法をBIに適応したものです。
・それらのサポートを可能にするBIツールを含みます。

2、なぜPentahoはアジャイルBIを?
・設計などに長期間をかけることなく、セルフサービスでのレポートやOLAP分析を早く提供するため。
・評価→検証を素早く、反復的に行うため。
・情報部門だけでなくビジネス部門などの関係者をよりプロジェクトに巻き込むため。
・よりシンプルに、簡単に、安価にプロジェクトを行うため。
・BIは小さく多様なチームで開発されるべきであるため。(DBA、分析担当者、コンサルタント、開発者、現場ユーザー)
→結果として、より多くのBIプロジェクトを成功に導くため。

3、アジャイルBIを行うために必要なBIツール
・早く簡単にBIモデルを作成できるツール
・少人数のチームで使えるツール
・広範囲なスキルセットに対応できるツール
・コストパフォーマンスの高いツール

現在、プロダクト単位でのコラボレーションや計画が進んでいます。
また詳細の機能についてはご紹介させていただきます。

例:以下のリンクにデモ動画があります。
ETLとOLAPアナライザーレポートのコラボレーション


★Have a nice Open Source Day★
KSKソリューションズ Pentahoチーム

AR.JPG



















今まで、PentahoのOLAPエンジン「Mondrian」は高速だけれど、OLAPビューワー「Jpivot」は少し使いづらいね・・・、という意見がありました。

そこで今回、Pentahoエンタープライズ版V3.5はダッシュボードデザイナーに加えて、OLAPビューワー 「アナライザーレポート」を追加しました。従来のJpivotではできなかったドラッグ&ドロップでの集計軸の設定、ピボットテーブルの作成、多様なグラフ設定で、エンドユーザーによる柔軟なOLAP分析を可能にします。

以下のリンクにサンプル動画ありますので、ご覧ください。(リンク先の画像左下の再生ボタンを押してください。)
また正式にリリースされましたら、弊社デモサーバでも体験いただけるようにしたいと思います。


http://michaeltarallo.blogspot.com/2009/10/pentaho-analyzer-is-here-imagine-that.html


★Have a nice Open Source Day★
KSKソリューションズ Pentahoチーム