2013年7月アーカイブ

Pentahoトレーニング参加者様の声

|
今週開催しましたPentahoトレーニングの参加者様より以下のコメントを頂きましたので、ご紹介致します。
----------------------------------------------------------------------------------------
BIとしての基礎部分からアジャイルBI等の目玉機能まで全体像・詳細共にわかり易く説明頂きました。
自分で手を動かしながら理解でき、私にとって今後の活用の土台を身につける大変良い研修でした。

株式会社オープンストリーム 田口 直志様
----------------------------------------------------------------------------------------
20130725.jpg


------------------------------------------------------------------
Pentahoの全体像をつかむ事ができるトレーニングでした。
非常に多機能なツールで、特にETLのインターフェイス数の多さ、柔軟性は
紹介資料から想像していたよりも強力なポイントに感じました。
また、OLAP向けDBの設計がOLTP向けDBの設計とまったく異なり、
パフォーマンスに大きく影響する点も勉強になりました。
今後は統計ツールのWekaのトレーニングも企画して頂きたいと思います。
 トランスコスモス・アナリティクス株式会社 市川 卓義様
------------------------------------------------------------------
ichikawa-san.jpg
------------------------------------------------------------------
非常に多機能なBIであるPentahoを操作しながら
ひとつひとつのツールの役割を理解することができる、
有意義なセミナーでした。
BI初心者の方にもお奨めできる内容だったと感じております。
また、私自身はSIer出身なのですが、
ETLの機能の豊富さと、対応するDBの間口の広さに驚き、
マット・キャスター氏のファンになってしまいました。
Pentahoはこの先まだ伸びると伺っておりますので
次のバージョンアップも楽しみにしております。
 トランスコスモス・アナリティクス株式会社 橋本 憲治
------------------------------------------------------------------
201307training-face3.jpg
田口様、市川様、橋本様はじめご参加いただいた皆様、ありがとうございました。

次回開催予定は9月3日から3日間となります。
未参加の方は以下ご参照の上、ぜひお申込み下さい。

★Please Join and Enjoy our training program★
KSK Analytics Pentaho Team

サロゲートキー

|
PentahoはOLAP分析を行うために、ディメンショナルモデルで格納されたデータを必要とします。ディメンショナルモデルは、分析するための数値を置いておくためのファクトテーブルと、その数値を分析する切り口になる項目を置いておくディメンションテーブルから成ります。

ディメンションテーブルのプライマリキーは、多くの場合、サロゲートキーになります。ファクトテーブルには、各ディメンションテーブルのプライマリキーを外部キーとするカラムを持たせます。

サロゲートキーは、各テーブルで、1から始まり、行が増えるごとにカウントアップしていく整数値で、ファクトテーブルと各ディメンションテーブルを結ぶ以外に意味が無い値になります。業務データベース上では、品番等それ自体に重要な意味があるコードがプライマリーキーになることが多いと思いますが、それらはディメンションテーブルではプライマリーキーにはなりません。それらのコードは、ディメンショナルモデルではナチュラルキーと呼ばれます。

サロゲートキーを付けるためにETL処理で一手間加えなければなりませんが、これにより様々な恩恵が得られます。

まず、更新履歴を残す(Slowly Changing Dimension Type 2)タイプのディメンションテーブルは、サロゲートキーなしにはちょっと難しいです。更新前の情報が残っているのでナチュラルキーは一意になりません。

ディメンションテーブルは通常、そんなに大きく行数が膨らまず、カーディナリティは低めですので、3、4桁の数字で事足ります。サイズが小さくて済みますので、検索スピードにも寄与します。OLAP分析はスピードが命です。

業務データベース上での変更にも、複数のデータソースからのデータ取得で、ディメンションテーブル上で齟齬が生じそうな時にも、サロゲートキーは一役買います。

全てのディメンションテーブルでサロゲートキーを使用するわけではありません。例えば、タイムディメンションはデータを更新することはまずありませんし、20130724といったそれ自体意味がある数値をプライマリキーにし、それをファクトテーブルから参照することで、膨大に膨れ上がるファクトテーブルを日付でパーティショニングする事も可能になります。OLAP分析はスピードが命です。

参考図書: Data Warehouse Toolkit
                 Data Warehouse Lifecycle Toolkit

DW/BIはレストラン

|
WILEYから出版のData Warehouse Toolkitの第1章にデータウェアハウスとビジネスインテリジェンス(DW/BI)がレストランに例えられ、DW/BIとレストランの類似点からDW/BIがどういうものか分かりやすく説明されています。

レストランが発展していくには、お客様に満足のいく体験を提供し、ロイヤルティを獲得していく必要があります。お客様の口にあったものを、丁度いいタイミングで出すのはもちろん、内装、照明、BGM等の演出もキーになります。

DW/BIのお客様はビジネスユーザーです。ビジネスユーザーに使われ続けることが、DW/BIにとっての成功で、発展への唯一の道です。ビジネスユーザーに使ってもらうには、今欲しい情報やこれまで見えてなかった情報を、しびれを切らさない内に素早く提供する事が必要条件です。
BIツールのインターフェイスはUI/UXにも配慮した方がいいでしょう。

食材は主に社内に蓄積された業務データです。それを調理室でETL処理し、オーダーを受けてから素早く調理に取り掛かり、複数の料理を丁度いいタイミング出せるよう、DWにデータをスタンバイさせる必要があります。コックさんは営業時間よりも長い時間を下ごしらえに費やしていると思いますが、DW/BIも同様に、ステージングエリアでのETL処理に手間暇をかけ、プレゼンテーションエリアに"使える"データを並べなければなりません。取り出すコストが大きい膨大なデータをすぐに取り出せるように膨大なデータを膨大なまま工夫して整理整頓しておかなければなりません。

Pentahoを導入することは、データインテグレーションやスキーマワークベンチを始めとする、作業効率を飛躍的に上げる調理器具が揃った、料理人のための調理室と、多くのお客様に気に入ってもらいやすいクリーンでポップな内装のダイニングエリア、直感的に使いやすい食器を手に入れることに等しいです。DW/BIの成功に大きく寄与すること請け合いのBIです。ビジネスユーザーがどのようなものを求めているか、どのようなものがビジネスに貢献できるか徹底調査、協議し、"使える"DWを構築することに大半のリソースを割けます。コスパが凄いです。
Pentahoには、DataSourceをユーザコンソール上から作成したり管理できる便利な機能(下のやつです)があります。
pda01.png

この機能は通常ですとAdmin権限を持ったユーザでないと表示できません。
pda02.png

ただし、一部のユーザには開放したい場合もあるかと思います。
そういった場合は、以下の箇所を変更して、BIサーバを再起動することで、権限設定の変更が可能となります。
(pentaho/server/biserver-ee/pentaho-solutions/system/data-access/settings.xml)
pda03.png

お試しください。


★Have a nice Open Source Day★
KSK Analytics Pentaho Team

データ分析のポイント

|
梅雨が明けて夏本番の猛暑がやってきました。日焼けや熱中症に注意が必要ですね。
(画像は夏のイメージで本文とは関係ございません)
top-image01.jpg

今回はPentahoに限らず、BI/BAを実施する時のポイントをいくつか記述してみました。

【必要なことを行う】
リアルタイム分析は本当に必要ですか?
必要なければ、日次、週次、月次、過去蓄積のデータで分析に注力しましょう。

【次のアクションに結びつける】
興味深いレポートができて終わりではなく、次のオペレーショナルなアクションにつなげましょう。
例えば、在庫が少なく販売が好調なら発注処理をする、Twitterで評判の製品はトップページに移動するなどです。

【最初はスピーディに適切な効果を出す】
スモールスタートのプロトではコストをかけず、結果がわかりやすいデータを一部抽出して1ヶ月以内にアウトプットをだしましょう。

【本番では全件処理、全パターン分析】
サンプリングするとその母集団をどう選んだかで結果が変わってしまいます。
ハードとソフトの性能は驚くべきスピードで進化中ですので、基本は全件処理で問題ないかと思います。

【ビジュアライズしてシンプルに核心をつかむプレゼンを】
結果報告はプロジェクトを拡大継続するためにも重要です。

【継続は力なり】
BI/BAに終わりはありません。成功している企業は常に刷新、継続させています。

当たり前と言えば当たり前のことばかりで他にもいろいろありますが、ご参考になれば幸いです。

★Have a nice BI/BA system★
KSK Analytics Pentaho Team

Pentahoトレーニング参加者様の声

|
先週開催しましたPentahoトレーニングの参加者様より以下のコメントを頂きましたので、ご紹介致します。(初回Blogアップ時から追加しています)
----------------------------------------------------------------------------------------
各種ツールの使い方に織り交ぜて、Pentahoの開発ロードマップなど
ご紹介頂き、興味深かったです。
今まであまり利用していなかったPDIツールの新たな使い方を知り、
是非とも、お客様への提案時に使いたいと思います。

OLAPとは?などの基本的な概念の話やモデルなどの設計のポイントも
説明してくださるので、初期設定に悩んでいるかたや導入を検討して
いる方に是非お勧めの講座です。

株式会社ブレインパッド 山口様
----------------------------------------------------------------------------------------
トレーニングBP20130627_170927.jpgのサムネール画像

-----------------------------------------------
Pentahoという名前は以前から知っており、興味を持っておりましたが、念願か
なって今回トレーニングに参加させて頂きました。
3日間の研修で、pentahoの機能を概要的に把握する事ができましたが、その機能
の多さに驚かされました。

今後、この素晴らしいプロダクトを自分のスキルとして身に着け、仕事に活かせ
るかどうかは、私自身の努力にかかってくると思いますので、頑張って勉強し
て行きたいと思います。
株式会社 オープンソース・ビジネスアプリケーションズ 萩原様
-----------------------------------------------

今回は受講者様のスキルや学習力がとても高く、講師がわからない点をさっと調べて解決いただくなど私にもよい刺激になりました。ご参加いただいた皆様からのフィードバックも含めてPentaho活用を共に広げていけたらよいと思います。

次回は7月23日から3日間の開催です。
こちらをご参照の上、ぜひご参加下さい。
★Please join and enjoy our training★
KSK Analytics Pentaho Team

今日から7月、体調を崩しやすい季節ですが暑い夏に向け頑張っていきましょう。
今回はPentaho Data Integrationを利用したレポートバースティングを動かしてみましたので、ご紹介致します。

以下がデータソースMySQLからデータを取得し、予め作成してあるレポートにデータを引き当てて店舗別損益計算書をPDFで作成しメール添付にて配信する例です。
nsmail-1.jpg
このような定型レポートの自動配信システム全体がPentahoなら数日で作成でき、日次、週次、月次等の報告書を処理できます。

Pentahoを利用すればSNSやRSSなどネット上のデータや携帯電話などが生成するビックデータを含む各種データソースを利用する自動レポート配信システムが、従来比数分の一のコストと時間で構築できるでしょう。

お問い合わせいただければ上記サンプルのご提供も可能です。
(フォームに7月1日Blogのサンプル希望とご記入下さい)

ぜひ皆様もご活用下さい。
★Have a effective report bursting system★
KSK Analytics Pentaho Team

2014年4月

    1 2 3 4 5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28 29 30