2011年10月アーカイブ

よくある質問

|
pentahoの体験版を含めると数多くの皆さまに使っていただいておりますが、
その中で、よくある質問をまとめておこうと思います。

①体験版をインストール後、アンインストールし、再度インストールを試みても、うまく稼動しない。

→同一マシンに再度インストールした場合、ライセンスは失われてしまいます。
 別マシンにインストールいただくか、別途ライセンスを発行しますので、サポートチームまで
 問合せください。
 ただし、
 別途ライセンス発行の場合、発効まで数日かかる場合があります。
 また、体験期間が30日以下になる場合もございますので、あらかじめご了承ください。


②スキーマワークベンチ(PSW)にて、パブリッシュ時に以下のようなエラーとなる。

pswErr.png

→workbench.bat(sh)のJavaの起動オプションに-Dfile.encoding="UTF-8"を追加し、再起動してください。
【修正例】
"%_PENTAHO_JAVA%" -Xms100m -Xmx500m -cp "%CP%" -Dlog4j.configuration=file:///%ROOT%\.schemaWorkbench\log4j.xml mondrian.gui.Workbench

"%_PENTAHO_JAVA%" -Xms100m -Xmx500m -Dfile.encoding="UTF-8" -cp "%CP%" -Dlog4j.configuration=file:///%ROOT%\.schemaWorkbench\log4j.xml mondrian.gui.Workbench


③アナライザーレポートからCSV出力で文字化けする。

→基本的にUTF-8で出力されますのでエクセルでCSVファイルを開くと文字化けします。
 (エクセルはshift-jisで開きますので)
 ver.3.8以降であれば、CSVの出力文字コードを指定できます。
 biserver-ee/pentaho-solutions/system/analyzer/analyzer.properties
 上記ファイルを編集。
 
 default.csv.encoding=shift-jis
 などとすればエクセルで開いたとしても文字化けしません。


④アナライザーレポートでPDF出力すると日本語が表示されない。

→デフォルトでは日本語フォント設定がされていないため、表示されません。
 biserver-ee/pentaho-solutions/system/analyzer/analyzer.properties
 上記ファイルを編集

(Windowsの場合)
 以下の行のコメントを外します。
#renderer.pdf.font.path=C:/WINDOWS/Fonts/MSGOTHIC.TTC,1
 ↓
renderer.pdf.font.path=C:/WINDOWS/Fonts/MSGOTHIC.TTC,1

(Linuxの場合)
必要なフォントをインストール後、
 日本語表示可能なフォントがあるパスを記載します。
例)
renderer.pdf.font.path=/usr/share/fonts/japanese/TrueType/sazanami-gothic.ttf


⑤レポートデザイナーのPDFプレビューで日本語が表示されない。

→(1)表示項目のfont設定(font-family)が日本語が表示可能なfontが設定されているか確認してください。
 (デフォルトはSerifなので、MSゴシックに変更するなど)
 (2)レポートデザイナーのメニュー
 「ファイル」-「レポート設定」より
  output-pageable-pdfのEncodingの項目を「utf-8」に変更してください。

prd-previewPDF.png



※バージョンにより、設定場所や名称が異なる場合があります。
 不明な点があればお問い合わせください。


★Have a nice Open Source Day★
KSKソリューションズ Pentahoチーム


PDIにてお手軽にパフォーマンスを向上させる方法がありますので、ご紹介させていただきます。

例えば、1000万件のデータを生成した後、Javaスクリプトステップにて複数のフィールドを追加するという処理を行うとすると、以下のようになるかと思います。

pdi_nocopy.jpg
実行すると、全て完了するまでに、「3分3秒」かかりました。

そこで、「Javaスクリプトステップ」を右クリックして、「コピー数の変更」を選択し、コピー数を「1」から「3」に変更します。
そうすると、「Javaスクリプトステップ」の左上に「x3」と表示されます。

pdi_copy.jpg
この状態で、もう一度処理を実行すると、「1分56秒」で処理が完了しました!
※実行するマシンスペックによっては更なるパフォーマンスアップが見込めますが、マシンスペックが低い場合ですと、あまり効果がでません。また、コピー数を増やしたステップ以外がボトルネックになっている場合も、効果が薄いです。
※処理を行ったPCのスペックは、CPU:CoreDuo U2400/1.06GHz、メモリ:1526MBです。

すべての行に同じ処理を行う場合は、同じ処理内容のステップを並べて並列実行する方法もありますが、コピー数の変更を行うことで、同様の処理をよりお手軽に行うことができます。

お試しください。

☆Have a strong data integration ☆
KSKソリューションズ

Pentahoトレーニング実施中

|
今週はPentahoトレーニングの一般募集コースを開催しております。
2011_10_18_10_11_06.jpg

Pentaho導入の初期段階で参加いただくのが一般的ですが、既にPentahoを導入いただいている企業の方ももう一度きちんと勉強したいということで参加いただいておりますし、導入検討段階のSIer様もご参加されています。

より早期の段階で効率よく習得いただくと仕事の効率(時間対効果、費用対効果)がよくなると思いますので、ぜひ皆様もご参加下さい。次回開催は2011年12月13日(火)~16日(金)です。

★Please join our Pentaho training★
KSKソリューションズ Pentaho Team


弊社のpentahoBIサーバデモサイトをバージョンアップしました。
最新版の4.0GAです。


全バージョンとの大きな違いのひとつは、
インタラクティブレポート機能です。
今までの新規レポート(アドホックレポート)よりもさらにグリグリ動かせて直感的にレポートが作れます。

以前のバージョン同様、
ユーザID:demo
パスワード:demo
にてログインできますので、お試しください。
URL:http://www.pentaho-japan.com/pentaho/Home

対応ブラウザは
・IE7,8,9
・Firefox3.6,4.x,5.x
・Safari4.x,5.x
・Chrome11.x,12.x


サンプルのデータも今後増やしていく予定です。
お楽しみに~♪


★Have a Great Open Source Day★
KSKソリューションズ Pentahoチーム


本ブログではSAS Institute社様※の製品にて利用可能なSASデータセットファイル読み込みデータ統合ステップ(SAS Inputステップ)の検証をご紹介いたします。

本検証内容はPentahoデータ統合プロジェクトのチーフアーキテクトのMatt Casters 氏からの発表を元に、SASデータセットファイル(*.sas7bdat形式)の読み込み機能がETL処理の一部として実行可能であるとの内容となっております。

参照元URL:

SAS Institute社 

本検証では以下のデータセットを利用させて頂きました。
データセット名:
candyinfo.sas7bdat

データセット取得元URL:

検証内容:

SAS_input.JPG

sas7bdat形式データのフィールドを取得SAS_input2.JPG

データ内容を参照
SAS_input3.JPG


弊社は皆様のビジネスの役に立つようにビジネスインテリジェンスだけではなく、DWH、ビジネスアナリティックスにも力をれておりますが、米Pentaho社もまたBAに対して本格的に取り組みを行っていくと言う姿勢が伺えるかと思います。

弊社では、ビジネスインテリジェンスおよびDWH、ビジネスアナリティックスと言う、戦略系ソリューションをワンストップでご提供させて頂いております。

戦略系システムの整備の必要がある、または戦略系システムの必要性を感じていられる
ご担当者様は一度、こちらから弊社までご相談下さい。

☆Have a strong data integration ☆
KSKソリューションズ
先日オープンソースBI/DB/BA製品であるPentaho/Infobright/Rapid-Iの紹介セミナーを開催いたしました。Pentahoの新バージョン4.0や、BIと相性のよいInfobright(DB)等をご紹介しています。
また今回は、外部より株式会社インターネットイニシアティブ荒木様からクラウド環境のサービスについて、Rapid-Iでは株式会社ef-prime鈴木様より利用例を交えてビジネスアナリティクスをご説明いただきました。

2011_10_04_13_41_17.jpg

次回の開催は11月15日(火)です。定員を超えることがありますので、ご希望の方は以下のページよりお早めにお申し込みくださいませ。Ustreamでの配信もいたしておりますので、会場と併せてご参加をお待ちしています。


★Enjoy our seminar★
KSKソリューションズ Pentahoチーム

スキーマワークベンチからスキーマをパブリッシュするとPUCのJPivotとAnalyzerのリストに表示されます。同じスキーマファイルであればスキーマワークベンチで編集後に再度パブリッシュを行っても既存の物に上書きされますが例えば新たなスキーマファイルを作成した為、既存のスキーマをJPivotとAnalyzerのリストから削除したいという場合、現在それらをPUCから削除する方法がありません。
そこで今回は不要になったスキーマをPUCのJPivotとAnalyzerのリストから削除する方法を紹介します。

スキーマワークベンチからスキーマをパブリッシュすると指定した箇所にxmlファイルが作成されますが、その時同時にpentaho-solutions/system/olap/datasources.xmlも更新されています。

remove_schema.jpg

datasources.xmlにはcatalogタグごとにパブリッシュしたスキーマの情報が記載されており、PUCのJPivotとAnalyzerのスキーマ選択リストはここの情報を元に生成されています。
パブリッシュしたxmlファイルを削除してもリストからスキーマのエントリーが消えないのはdatasources.xmlにエントリーが残っている為です。
削除したいスキーマのcatalogタグをdatasources.xmlから削除し、BIサーバーを再起動するとJPivotとAnalyzerのリストからスキーマは削除されます。

★Have a nice Open Source Day★
KSKソリューションズ Pentahoチーム

本ブログではJDBC Kettle プロジェクトのご紹介を行いたく思います。

JDBC Kettle プロジェクト
http://code.google.com/p/jdbckettle/

lucidDBを提供しているDynamoBI社※のCEOであるNicholas Goodman氏を中心に
PDIのチーフアーキテクトであるMatt Casters氏も参加しているプロジェクトになります。

※DynamoBI社


本プロジェクトの特徴は、PDI(Pentahoデータ変換)にて定義したETL処理ロジックから
データの取得を行えるものでPentahoレポートデザイナ等でも使用されています。

今回は、実際に本プロジェクトの成果物を利用し以下の検証を行いました。

■ETL処理ロジック定義を定義
定義内容:
1.CSVファイルの読み込み(元データ)
2.時系列順で並び替え
3.HDFSよりCSVファイルの読み込み(追加データ)
4.年をIDとしてストリームの結合
5.MongoDBよりデータ取得
6.取得データの解析(JSONオブジェクト→ストリーム)
7.年をIDとしてストリームの結合
8.データ出力

・定義内容

PDI_datasource.JPG


・データプレビュ
PDI_datasource2.JPG


■上記定義内容からJDBCドライバ経由にてデータを取得

・PDI定義体への接続設定

kettle_connection_object.JPG

・定義体よりスキーマオブジェクトの一覧を取得
kettle_jdbc_schema_object.JPG


・データプレビュ
kettle_jdbc_data_preview.JPG


上記の様に、異なるアプリケーションのデータ統合を定義し他のデータベースベンダ様が提供されているJDBCドライバをご利用になった時と同様にクエリ構文形式でデータ取得を行う事が可能となります。

社内の開発担当部署の方々へのご説明を行うプロジェクト責任者様は、
社内でのコンセンサスを得やすくされる為に、PentahoをBIとしてのみ利用する事に加味し、
システム開発の上でも工数削減を行える事を訴求されるのも一つのアプローチかと思います。

また弊社へご相談いただけますと、社内へのご提案を含めたご支援が可能ですので、
ご興味を抱いて頂いたご担当者様はこちらよりお問い合わせください。

☆Have a nice business implementation ☆
Pentahoチーム

2014年4月

    1 2 3 4 5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28 29 30