2013年5月アーカイブ

弊社パートナーのテクマトリックス株式会社様が、Pentahoを利用するBIソリューションについて5月30日付でプレスアナウンスを実施されました。

nl-techm.jpg

Pentahoは自由度と拡張性の高い製品のため、ソリューション展開しやすくSIer様のビジネス展開に最適です。

ぜひ皆様もご活用下さい。
★Have a nice BI/BA Solution★
KSK Analytics Pentaho Team


JB Group IT Forum2013

|
弊社パートナーのJBCC様が開催されるJB Group IT Forum 2013にPentaho,Infobrightを展示出展させて頂きます。
JBCITforum.jpg
お時間のある方はぜひ以下より事前お申込みの上、ご参加下さい。
よろしくお願い致します。
KSK Analytics Pentaho Team

JDMCは創立されて3年目ですが活発に活動する団体で、大手ベンダー、ユーザー
企業様が並ぶ中で末席に加えさせていただき欣快の至りです。
JDMC.jpg
一昨日総会に参加し、各社様の研究発表を拝聴致しました。
業界のの重鎮、エース級の方々が参加されるだけあって参考となる内容が多く勉強になります。
私達も培ったオープンソース系BIのノウハウを共有し日本の業界に貢献できればと思います。

よい団体ですので、データ管理、データ活用にご関心がある皆様はご参加検討されてはいかがでしょうか?

★Please join and enjoy JDMC activity★ 
KSK Analytics Pentaho Team

TreasureDataへの接続(PDI編)

|
Pentahoは、さまざまなデータソースに対しアクセスできますが、今日はクラウド上でDWHを提供しているTreasureDataを使用する例をご紹介したいと思います。

なお、TreasureData社さんに関しては、すでにいろいろと情報が出ていますので詳細な説明は割愛させていただきます。
特に以下のブログが詳しかったのでご紹介しておきます。
http://d.hatena.ne.jp/naoya/20130322/1363946401

それでは早速、PDIからTreasureDataへクエリを投げて結果を取得するというものをご紹介いたします。
TreasureDataへの接続関しては、TreasureData社さんが作成しているJDBCドライバを使用します。
なお設定方法等についてはこちらに詳しく書かれておりますが、簡単に言えばJDBCドライバをPDIの指定の場所に配置して、コネクションの設定を行うだけで使用できてしまいます。
※今回は、PDI4.4.0 + td-jdbc-0.2.2-jar-with-dependencies.jar で検証しています。


まずは、JDBCドライバをダウンロードし、以下の場所に配置します。
<pdi-home>/data-integration/libext/JDBC/td-jdbc-0.2.2-jar-with-dependencies.jar

次にTransformationを新規作成し、コネクションを作成します。
以下の様な感じです。
td_pdi_1.png

コネクション作成後は「TableInput」ステップにて、SQLを書くとTreasureDataにてデータを取得して結果を返却してくれます。
以下の様な感じです。
td_pdi2.png

また、TreasureData側では以下の様なJOBが実行されています。
td_pdi3.png

「TableInput」ステップにてデータを取得したあとは、通常のETL処理になりますので、PDIにてデータ加工等を行います。
TreasureDataを有効的に使用するためには、大量データの集計に関してはTreasureData側で全て済ませてしまい、その後別のデータソースと結合する処理をPDI側で実行するという方針となるかと思います。

今日は、まずはPDIからどのように接続できるかというのを簡単にご紹介しましたが、JDBC経由での接続となりますので、PDIだけではなくBIサーバから直接接続することももちろん可能となります。
その他の使用方法等については、追って本ブログにてご紹介して参りますので、しばしお待ちいただければ幸いです。
もし早急に情報を知りたいということであれば、こちらよりお気軽にご相談ください


今日のところは以上です!

★Have a nice Open Source Day★
KSK Analytics Pentaho Team

先月の話になりますが、Pentaho社がポルトガルのWebDetailsというベンチャーを買収しました。
webdetails.jpg

WebDetails社のサイトは最先端を感じさせるすばらしいデザインで、UserExperienceとDashboardに特化した製品を提供しているようです。このチームがPentahoのUI作成に影響を与えると考えるだけで、わくわくします。よろしければ皆様もご参照下さい。

世界中が簡単につながるのがIT業界ですので、日本からもぜひこのような製品が出るとよいですね。Pentahoは接続性がよく自由度が高いのが大きな特徴です。
皆様もソリューションの拡大にご利用下さい。

★Have a  nice user experience★
KSK Analytics Pentaho Team
定型レポートは、パフォーマンス向上のため、レポート内容を内部にキャッシュします。
Queryベースで結果を保持しますので、負荷の高いQueryを実行するレポートの場合にはパフォーマンスの向上が見込めます。
ただし、その弊害として、データが更新されたとしてもそれを検知できず、過去のデータを表示し続けてしまうという恐れがあります。

通常であれば、レポートのキャッシュデータを更新する機能を実行することで、最新データを取得することができます。
以下の様な感じです。
report1.png


さらに、特定レポートにおいて、データ更新の頻度が高く表示するたびにキャッシュクリアを行うことが効率的ではない場合は、以下の方法を採用することも一案です。
report2.png
レポートデザイナーにて、"data-cache"を"false"に変更することでレポート単位のデータキャッシュの無効化が可能です。


すべての定型レポートでキャッシュする必要がない場合は、以下のファイルを更新することで、無効化することも可能です。
<pentaho/server/biserver-ee/tomcat/webapps/pentaho/WEB-INF/classes/classic-engine.properties>
report3.png
"org.pentaho.reporting.engine.classic.core.cache.DataCache=" を追加して、BIサーバを再起動します。


さらに、キャッシュの細かい設定は、以下のファイル内で変更できますので、ご興味のある方は、一度ご確認いただければ幸いです。
<pentaho/server/biserver-ee/tomcat/webapps/pentaho/WEB-INF/classes/ehcache.xml>


どのような場合にキャッシュを切るべきか等、レポート設計に関わる問題にもなってまいります、その辺り、弊社にてご相談にも応じられるかと思いますので、お気軽にご連絡いただければ幸いです

★Have a nice Open Source Day★
KSK Analytics Pentaho Team

本日、ご好評を頂いている無料製品紹介セミナーを実施させて頂きました。
20130509seminar.jpg

今回は東京カンファレンスセンター(アレア品川)を会場として利用し、照明や音響など環境にも配慮した最新の仕様で満席のご来場様にもより快適に聴講頂けたかと思います。

ご参加いただいた皆様、ありがとうございました。

次回は6月5日の開催予定となります。
まだ未参加の方はぜひこちらをご確認の上、お早目にお申込み下さい。

★Please join and enjoy our seminar★
KSK Analytics Pentaho Team

本番環境での留意点

|
ゴールデンウィークはお天気もよく、皆様快適に過ごされましたでしょうか?

今回はPentahoを本番業務環境で使用する場合の留意点をいくつかご紹介いたします。


1.サンプル、デモ用のDBサーバーは停止する
PentahoのデフォルトではhypersonicというDBサーバーエンジンが起動する設定になっています。
試使用ではサンプルレポートを表示する時などに便利ですが、本番では不要ですので停止の設定にします。

2.ログレベルはエラーのみに
 テスト環境では詳細ログで動きを確認することがありますが、ログをとる負荷
もかかります。本番システムではログはエラー情報のみをとる設定にします。
pentahologlebel.jpg

3.バックアップ/リカバリ運用の確立
 障害時に備え、手順を確立しテストしておきます。
 (ハード構成や要件にも依存)


ユーザー管理や負荷分散、その他にもPentahoに限らずWeb系アプリケーションで一般的な留意点がいろいろありますが、いくつかをご紹介致しました。

弊社ではプロフェッショナルサービスもご提供しております。
詳細は弊社ならびに弊社パートナーにお問い合わせ下さい

★Have a nice Pentaho production environment★
KSK Analytics Pentaho Team

デフォルト設定でBAサーバーをインストールすると評価用コンテンツのサンプルデータがインストールされます。サンプルデータが必要ない場合は以下の手順で削除する事ができます。

1、BAサーバーを停止する。

2、以下のディレクトリを削除する。
  /biserver-ee/pentaho-solutions/steel-wheels/
  /biserver-ee/pentaho-solutions/bi-developers/

3、テキストエディタで/biserver-ee/tomcat/webapps/pentaho/WEB-INF/web.xmlを開く。

4、以下のサンプルservletを削除する。
sample_servlets.png

5、以下のサンプルservlet-mappingを削除する。
sample_servlet_mapping.png

6、SampleDataStartupListenerを削除する。
SampleDataStartupListener.png

7、hsqldb-databasesセクションを削除する。
hsqldb-databases.png
8、SystemStatusFilterを削除する。
SystemStatusFilter.png
9、SystemStatusFilterのmappingを削除する。
SystemStatusFilter_mapping.png
10、web.xmlを保存する。

11、/pentaho/server/biserver-ee/data/を削除する。

サンプルデータが削除されました。

★Have a nice Open Source Day★
KSK Analytics Pentaho Team

prptファイルの正体

|
いよいよ5月、新緑の季節です。近場のお散歩でもリフレッシュできて気持ちがよいですね。

今回はPentaho定型レポートのTipsをご紹介します。

ReportDesignerで作成したレポートファイルはファイルタイプが.prptになります。他のクライアントツールで作成したファイルはテキストエディタで開けるのですが、このファイルは開けません。
実は、PRPTファイルは各種xmlファイルを含むjarファイルなのです。
7zipなどの圧縮解凍ツールを利用することで、構成がわかります。
prpt1.jpg

例えばこの中にあるsqlds.xmlがデータソース情報を含んでいますので、もしツール外からデータソースを変更したい場合はこれをテキスト編集することで実現できます。
prpt2.jpg

このように柔軟性と自由度が高いのがオープンソース系ソフトウェアであるPentahoの利点です。

注意:標準ツール外の操作でトラブルが発生した場合、弊社サポートが対応できないこともありますのでご留意下さい。

★Have a nice golden week★
KSK Analytics Pentaho Team

2014年4月

    1 2 3 4 5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28 29 30