オープンソースBIのPentaho(ペンタホ)ブログでタグ「BI」が付けられているもの

本日3月2日にPentaho社より公開されたPentaho BIスイート 4.5RCリリース新機能の
ご紹介を行います。

Pentaho 4.5 BIスイートプロジェクトの概要については以下URLをご参照(英語)頂けますが、
本バージョンでは特にビジュアル化機能のおよび、ビッグデータ対応への強化が
行われております。

Pentaho BI Suite 4.5

本バージョンのコンセプトは、ユーザ駆動BI (User Driven BI) ※1となり、
BI基盤の利用者(ユーザ)は手間をかける事なく分析業務を行って頂ける製品構成と
なっております。

※1ユーザ駆動BI
パワーユーザ、管理者だけではなくBI基盤のユーザが、データのインポート/レポーティング/分析
を容易に行う事が可能な機能を持つビジネスインテリジェンス基盤

弊社では、日本国内の顧客様が快適に使用していただく為に製品検証を行っており
検証後に製品リリースのアナウンスを行う予定になっております。

本ブログの締めくくりに強化されたビジュアル化機能の一例を画像にてご紹介致します。

■地理情報連動型チャート機能
4.5RC_1.jpg

■ヒートマップ
4.5RC_2.jpg

米Pentaho社が提供するビジネスインテリジェンス製品に関してのお問い合わせは
問い合わせフォームからお願いいたします。

☆Have a User Driven Business Intelligence
☆Professional BI team @ KSK Solutions, inc

弊社に対する顧客様からのご相談事項に、Bigデータ統合は無論の事ながら、
BA案件も急激に増加している事を証左にBIからBAへの昇華は着実に
進んでいると実感している今日この頃です。

今回のブログではBIサーバーの表現力を用いて以下取組を簡単に行いました。

概要:
・弊社ブログ情報を取集し、月単位※で情報発信内容の推移を観察
※ブログ投稿頻度に依存(断続的に投稿している最小単位)

方法:
・弊社が発信した全てのブログ情報をクローリング(html形式で収集)※1
・収集データを品詞単位に分割し、相関ルールマイニングにより頻出語※2の抽出

※1
不要タグ、ノイズはプログラムにて事前に除去
(既知の出現頻度の高い品詞:KSKソリューションズ, Pentaho等)

※2
1.出現語リストに対する各語に対し、支持度の算出
2.信頼度の算出の為に各出現語に対し、 c = P(X|Y)式の適応
3.支持度および、信頼度が閾値を超えたデータを分析対象として保存

参照リソース:
長尾光悦 大内 東.観光地に対する風評被害の変換と対応分析.人工知能学会誌.26(3),2011,264-271.

keyword_appriori_1.JPG

分析レポートで結果確認を行うと、弊社の情報発信内容の推移が
頻出度によって確認する事が出来ます。
(表示画像は上位10位に絞り表示)

また任意の出現語のみに焦点を当て、フィルター機能を使用する事により
特定の出現語による定点から発信内容の推移を考察する事も可能になります。

例:PentahoHadoopベータ検証が終了し、市場へ投下した2010年10月には
Hadoopを題材にしたブログの投稿が増加した等

keyword_hadoop.JPG


本取組の成果物も、順次デモサーバーにアップロードしてまいりますので、
パフォーマンスが改良された3.8.0GAのデモサイトと合わせてご覧ください。

☆Have a nice analysis integration with Pentaho
☆KSKペンタホチーム
BI(ビジネスインテリジェンス)のプロジェクトで弊社もよく遭遇する問題は、お客様も明確なアウトプットイメージ(どんなダッシュボードを構築したらいいのか、どんなキューブを作ればいいのかetc)を持っておられないことが多いことです。

業務システムと違い、BIの場合は設計仕様をしっかり決めることは、難しいものです、なぜなら、「どのように分析すれば成果が上がるか」というものは、やってみなければ分からないからです。良くテンプレートを活用するということも話題に上がります。しかし、一般的なテンプレートはプロジェクト初期段階においてイメージを持つためには効果はあるものの、それが自社にとって最適なものとは限りません。

結局、BIだけでなくマネジメント全般に言えることかもしれませんが、計画する→試す→検証する→再度計画する、のプロセスが重要になります。

一方で、一般的に商用BIツールは非常に高い買い物です。ちょっと試すには、慎重を重ねた検討とリスクを受け入れる勇気が必要となります。その点、オープンソースBI「Pentaho」は、低価格と高機能を併せ持つツールです。有償版であってもソフトウェアを購入する必要はなく年間サポート費用ですべて機能が使用できます。(少し営業臭くなり申し訳ありません)

さらに来年Pentahoは、BIでより成果を出すために、これらを進化させます。
来年のPentahoのテーマは、「アジャイルBI (Agile BI)」です!

1、アジャイルBIとは?
ビジネスインテリジェンス構築のための、迅速かつ軽量、反復的な開発アプローチです。
ソフトウェアアジャイル開発手法をBIに適応したものです。
・それらのサポートを可能にするBIツールを含みます。

2、なぜPentahoはアジャイルBIを?
・設計などに長期間をかけることなく、セルフサービスでのレポートやOLAP分析を早く提供するため。
・評価→検証を素早く、反復的に行うため。
・情報部門だけでなくビジネス部門などの関係者をよりプロジェクトに巻き込むため。
・よりシンプルに、簡単に、安価にプロジェクトを行うため。
・BIは小さく多様なチームで開発されるべきであるため。(DBA、分析担当者、コンサルタント、開発者、現場ユーザー)
→結果として、より多くのBIプロジェクトを成功に導くため。

3、アジャイルBIを行うために必要なBIツール
・早く簡単にBIモデルを作成できるツール
・少人数のチームで使えるツール
・広範囲なスキルセットに対応できるツール
・コストパフォーマンスの高いツール

現在、プロダクト単位でのコラボレーションや計画が進んでいます。
また詳細の機能についてはご紹介させていただきます。

例:以下のリンクにデモ動画があります。
ETLとOLAPアナライザーレポートのコラボレーション


★Have a nice Open Source Day★
KSKソリューションズ Pentahoチーム

2018年11月

        1 2 3
4 5 6 7 8 9 10
11 12 13 14 15 16 17
18 19 20 21 22 23 24
25 26 27 28 29 30  

月別 アーカイブ