Pentaho Analysisの最近のブログ記事

現在Pentaho上でPluginとして使用できるデータ可視化ツールを開発中です!

下は、基本的な表示イメージです。
octaba1.png
左のウィンドウに配置されている分析軸を真ん中のウィンドウに配置することで、右側のウィンドウでデータを可視化することが可能です。

数値(メジャー)の場所を変更することも可能です。
octaba2.png

チャートを作成することも可能です。
octaba3.png

octaba4.png

octaba5.png

octaba6.png


基本機能としては、上記以外にPentaho商用版のAnalyzerレポートでも可能な、フィルタ機能や表示する行列の制限機能、数値のフォーマット、ドリルダウン等が使用可能です。

また、その他の機能として、
・メジャー表示位置の指定が可能
・キューブの選択が同一画面で可能
・ディメンションやメジャーの検索機能
・画面の初期化機能
なども追加しています。

開発中とはなりますが、以下のデモサーバで実際に動かすことができますので、ぜひお試しください。
※ログイン後の画面から「新規作成」ボタンを押下、「Octaba View」ボタンから実行できます


今年の夏頃にリリースできるように開発している状況ではありますが、現状でも詳細な仕様のご説明などの希望がございましたら、以下よりお気軽にお問い合わせください。


以上です!
Mondrianはアナライザー等のアプリケーションから受け取ったMDXクエリーを元にSQLクエリー発行してデータベースからデータを取得するので、データベースがパフォーマンスのボトルネックとなっている事が多く、Mondrianのパフォーマンスに問題がある場合はデータベースのパフォーマンスを最初に確認するのがよいとされています。

Pentahoは実行したMDXクエリーとSQLクエリーをログに出力する事ができるので、パフォーマンスに問題のあるクエリー実行後にログを確認し、全体の処理時間の大半をSQLクエリーが占めているようであればデータベースにチューニングが必要だと判断する事ができます。

データベースのチューニング方法はデータベース毎に異なりますが、Mondrianを利用するにあたり、ディメンションのプライマリキーにインデックスを作成する事が、有効な対策の1つです。
インデックスの作成により実行に数分かかっていたクエリーが数秒になったという事例もあります。

データベースの中には分析クエリー用に設計された物もあり、それらはインデックスの作成やクラスタリングなど、高速なレスポンスに必要な処理を自動で行ってくれます。可能な場合はMondrianのデータソースには分析データベースを利用する事をお勧めします。

★Have a nice open source day★
KSK Analytics Pentaho Team

PentahoWorld2014のビデオ

|
昨年のPentahoWorld2014のビデオがYouTubeにアップされました。

PentahoWorld 2014 Highlights

さらなる詳細は、こちらの再生リストをご覧ください。
再生リスト:PentahoWorld 2014

オススメは、こちらのMatt Casters(PDIの開発者、Chief Data Integration, Kettle Founder)の講演です。
Pentaho Data Integration Best Practices
→ チーフ開発者によるPDI(ETL)のベストプラクティスの紹介です。



よろしければご覧ください!

Have a Great Open Source Day
KSK Analytics Pentaho Team

地図マッピング

|
台風11号の影響で河川氾濫などで各地に被害がありました。被災された方々にお悔み申し上げます。

降水量や放射能汚染状況を表示するなど地図マップ表示は分かり易いため、TVニュースやインターネットでも活用されています。
Pentahoアナライザーにも地図マップの機能が標準装備されており、簡単に使用できますので試してみました。

まずはデータの用意です。霞が関官公庁のe-statというシステムから様々な統計データがダウンロードできます。
今回利用するのはお米の生産量。少し加工しCSVで用意します。
okomecsvdata.png

Pentahoにブラウザでログインし、データソース管理からデータソースウィザードを選択して取込みます。
geomap1.png

そのままキューブの定義体が自動作成され、少しいじります。地理タイプを設定するのがポイント。
geomap2.png

アナライザーレポートでできあがったキューブを選択し、チャートからGeoMapを選ぶだけで地図上に表示することができました。
geomap.png

地図はオープンストリートマップかGoogleマップを選択できます。(GoogleMapの利用は有償のようです)

内部的にはMondrianキューブの定義体(xmlファイル)内でレベルにアノテーション定義を追加することになります。詳細はこちらの記述もご参照下さい。緯度経度をデータで与えれば、店舗の場所にマップすることもできそうです。

人口統計や食物生産量などを時系列に組み合わせて視覚化することで、新たな気づきが生まれるかもしれません。ぜひお試しください。

★Have a nice summer vacation★
KSK Analytics Pentaho Team


今日も、こまかな設定のご紹介です。
Pentaho5.1から、アナライザーのドリルスルー時のカラム選択が可能となっています。

5.0.x系でドリルスルーする際には、カラム選択が出来ませんので、リンクしているディメンションを全て出力することになります。
drill1.png


Pentaho5.1からは、以下のようにドリルスルー時の出力カラムを選択することが可能です。
drill2.png

例えば、「Territory」のみにカラムを絞って出力すると以下のように表示されます。
drill3.png

以前のバージョンでは、全てのカラムが出力されてしまうため、ディメンションが多い場合にドリルスルー後のデータが見づらく、加工もしづらいものとなっていました。
本当に必要なディメンションのみに出力を絞ることで、より使いやすくなったのではと思います。
ドリルスルー時のカラム量の多さにお困りの方は、ぜひPentaho5.1のご利用をご検討ください。

★Have a nice open source day★
KSK Analytics Pentaho Team

こまかな話で恐縮ですが、今回はPentaho5.1で機能追加された「アナライザーの並べ替えボタン」をご紹介したいと思います。

5.0.2などの5.0.x系でアナライザーを確認すると、以下の様になります。
sort1.png
ディメンション上には、並び替え用のボタンが無く、レイアウト側のディメンションのプロパティから並び替えを指定する必要がありました。クリック数が多く、いささか煩雑です。


5.1では、以下のようにディメンションの横に並び替えボタンが表示されるようになり、より使いやすくなっております。
sort2.png

ちょっとしたことですが、このようにユーザビリティの改善が進んでおります。
今後も、さらに使いやすさを追求して開発が進んでいくと思いますので、ご期待ください。


★Have a nice open source day★
KSK Analytics Pentaho Team

快適な気温と湿度で気持ち良い季節がやってきました。

Pentahoの操作も気持ちよく行いたいものです。
OLAP(多次元分析)ではドリルダウン、ドリルアップ、ドリルスルーという操作が可能ですので
ドリルスルーの設定について操作方法を見てみましょう。

まず作成したレポートの"レポートオプション"ボタンをクリックします。


次にポップアップ画面が出てきますので、ドリルスルーの部分にチェックを入れます。
drillthrogh2.jpg

数値セルに下線がつきますので、クリックすると明細が表示されます。
drillthrogh3.jpg

簡単ですが、本日は以上です。
★Enjoy your Pentaho operation★
KSK Analytics Pentaho Team
今日は、Mondrianのセキュリティ制御のデフォルト以外の設定方法について書きたいと思います。

Mondrianのセキュリティ制御の設定はお馴染みのやつです。こんなのですね。
mondrian_mapping1.png

ご存知のとおり、Workbenchでロールがどのキューブ、ディメンション、データにアクセスできるのかを定義する必要があります(上の画像の射的の的みたいなやつです)。

デフォルトですと、One-to-One-Mapping設定というものになっています。

この設定の場合は、BIサーバで管理しているロール名でスキーマ定義内のロール設定を定義していく必要があります。
名前どおり1対1でロールを設定してくいため、BIサーバのロール変更によって、スキーマ定義側の変更が必要になる可能性が高いです。

上記のような状況を少々改善するもう一つの設定方法として、「SampleLookupMapping」というものがあります。
この設定の場合は、BIサーバで管理しているロールとスキーマ定義内のロールの間で、一度マッピングを行うことができ、デフォルト設定よりも変更によるコストを低減することが可能となっています。

設定方法としては、biserver-ee\pentaho-solutions\system\pentahoObjects.spring.xml にて、以下のように行います。
mondrian_mapping2.png
①One-To-Oneマッピングをコメントアウトして、SampleLookupマッピングのコメントを外します。
②entryにて、BIサーバのロール名とスキーマ定義側のロール名をマッピングします。
keyがBIサーバ側、valueがスキーマ定義側です。
③BIサーバを再起動します。

ここの例ですと、BIサーバにceoロールを持つユーザでログインした場合は、スキーマ定義側ではM_CEOロールで制御が行われるイメージです。

使用方法が分からない場合などは、お気軽にご相談ください。

今日のところは以上です。

★Have a nice open source day★
KSK Analytics Pentaho Team

皆様のシステムでは、Webブラウザ画面に何件程度のデータを表示させていますでしょうか?

1画面に50件データを表示させて、20ページ分となれば人間が目で参照して有効な情報を利用できる上限を超えています。
またデータは集計してグラフ化することで、より理解しやすくビジネス活用が広がるのではないでしょうか?

加工前データの抽出ツールとしてブラウザでBIを利用するインプリを散見しますが、ほとんどの場合使い勝手やパフォーマンス面が悪くなります。
このような場合はPentahoならバックのETLスケジュール処理等で対応が可能です。

Pentahoにはブラウザで新規レポートを作成する機能にアナライザーレポート、インタラクティブレポートがありますが、それぞれデータ件数上限が設定できます。
analyzerlimit.jpg
アナライザーレポートでは、analyzer.propertiesとmondrian.propertiesのパラメーターで件数を設定します。

interactivereportlimit.jpg

またデータベース側でも接続数、アクセス件数、接続時間などの上限を決めることができる製品が多いです。

ユーザーが快適に使用できるように最適化する各種方策がありますので、よろしければご相談下さい。

★Have a nice user experience★
KSK Analytics Pentaho Team
アナライザーレポート上では、ショートカットキーが使用できます。

一番使うものとしては、UndoやRedoかと思います。
軸やメジャーの追加や削除、フィルターの追加などの作業を元に戻したり、進めたりすることが出来ます。
Undo: Ctrl + Z
Redo: Ctrl + Y

Resetでは、全ての軸やメジャーを削除して、初期状態に戻すことが出来ます。
Reset: Ctrl + Q

フィールドリストやレイアウトパネル、フィルターの表示・非表示は、それぞれ以下のキーが使用できます。
フィールドリストの表示・非表示: Ctrl + Alt + F
フィルターの表示・非表示: Ctrl + Alt + T
レイアウトパネルの表示・非表示: Ctrl + Alt + Y

アナライザーを頻繁に使用される方には、重宝する機能かと思います。
一度、お試しください。


また、ショートカットキーはHelp上でも確認できます。
Helpはアナライザーレポートのレイアウトパネル下にあるレポートオプションからアクセスすることが可能です。
analyzer_help.png


今日のところは以上です。


★Have a nice open source day★
KSK Analytics Pentaho Team

2017年6月

        1 2 3
4 5 6 7 8 9 10
11 12 13 14 15 16 17
18 19 20 21 22 23 24
25 26 27 28 29 30  

月別 アーカイブ