Pentaho Projectの最近のブログ記事

データ分析のポイント

|
梅雨が明けて夏本番の猛暑がやってきました。日焼けや熱中症に注意が必要ですね。
(画像は夏のイメージで本文とは関係ございません)
top-image01.jpg

今回はPentahoに限らず、BI/BAを実施する時のポイントをいくつか記述してみました。

【必要なことを行う】
リアルタイム分析は本当に必要ですか?
必要なければ、日次、週次、月次、過去蓄積のデータで分析に注力しましょう。

【次のアクションに結びつける】
興味深いレポートができて終わりではなく、次のオペレーショナルなアクションにつなげましょう。
例えば、在庫が少なく販売が好調なら発注処理をする、Twitterで評判の製品はトップページに移動するなどです。

【最初はスピーディに適切な効果を出す】
スモールスタートのプロトではコストをかけず、結果がわかりやすいデータを一部抽出して1ヶ月以内にアウトプットをだしましょう。

【本番では全件処理、全パターン分析】
サンプリングするとその母集団をどう選んだかで結果が変わってしまいます。
ハードとソフトの性能は驚くべきスピードで進化中ですので、基本は全件処理で問題ないかと思います。

【ビジュアライズしてシンプルに核心をつかむプレゼンを】
結果報告はプロジェクトを拡大継続するためにも重要です。

【継続は力なり】
BI/BAに終わりはありません。成功している企業は常に刷新、継続させています。

当たり前と言えば当たり前のことばかりで他にもいろいろありますが、ご参考になれば幸いです。

★Have a nice BI/BA system★
KSK Analytics Pentaho Team
今回は、Pentaho社が外部向けに公開しております
製品ロードマップの情報を紹介します。

Pentaho社製品はオープンソースでの製品開発がベースとなりますので、
リリース予定のバージョンにてご提供できる機能が製品ロードマップ(英語)としても
公開しております。

Product Management

roadmap_1.jpg

上記は、どの製品が今現在リリースに向けてどのような開発状況であるかを
把握いただく事が可能となり、以下では次期リリース予定のバージョンの製品情報
を把握いただく事が可能です。

roadmap_2.jpg


今回、ご紹介いたしました内容はPentaho社が外部向けに公開しております情報となりますが、Pentaho社がパートナーのみ提供している情報もございます。
直接お問い合わせ頂ければ、BIシステム構築支援のご相談、BIを使用した情報活用支援のご相談、Pentaho社製品に対する最新の詳細情報をご紹介いたしますので、一度弊社までご相談ください。

☆ Pentaho Analytics makes it efficient.
☆ Pentaho professional team at KSK Solutions, inc 
「PentahoアジャイルBI 速く、柔軟で、効果の高いBIプロジェクト手法」を翻訳しました。原文は、PentahoのChief Geekであるジェームス・ディクソンが執筆したものです。こちらからダウンロードいただけます。BIに関わるすべての方に参考になると思います。

以下、サマリーより抜粋:
アジャイルBIは、経済性と実効性を劇的に改善することで、従来のBIプロジェクトの概念を変えるものです。「リソースが調達できたら、来期から始められるかもしれない」という代わりに、こう言います。「今日の午後から始めよう」と。





★Have a Great Open Source Day★
KSKソリューションズ Pentahoチーム

Making Hadoop Easy

|
昨日、ある案件の為の検証目的で、アプライアンス型商用Hadoopクラスター上にて、
Pentaho Hadoop統合機能の検証を行う機会を頂きました。

fotm_pentaho_for_hadoop.pngのサムネール画像

検証内容に対する詳細事項の記載は割愛させて頂きますが、
以下2点を本検証の主な目的といたしました。

1.Pentaho Hadoop統合機能を利用しプログラミングレスで大量データに対するバッチ処理内容を実装

2.上記バッチ処理をHadoopクラスター上で行い大量データの処理および性能を検証

アジャイルソフトウェア開発というソフトウェア開発の手法がありますが、Pentahoでもこの手法でBIの開発に着手しています。PentahoのプリセールスVPのMichael Taralloのブログで解説されていますのでご紹介します。


原文はこちら : 

http://michaeltarallo.blogspot.com/2010/04/being-agile-with-pentaho-business.html


  "「アジャイル- Agile-」であること" があなたの意思決定を支援します

 

まだ多くの企業ではBIのストラテジーを標準化できていません。例えば多くの企業でスプレッドマート(Excelの百貨店)状態になっている話をよく耳にします。これらの企業では、BIソリューションを実装しない方法に基づいて紙ベースのソリューションを行っています。「スプレッドマート」は多くの場合、時間がない、予算がない、BIソリューションのデプロイメントが遅いなどといった場合に、代替ソリューションとして使われます。

日々、多様な側面からPentahoのソフトウェアが多くの悩みを解決できることをコンサルティングさせていただいていますが、お話を伺うとビジネス上のニーズが見えてきます。彼らは、複数の部門が個別に持つデータソースを一元管理することだけでなく、コストを削減し、利益を増やし、競争力のある製品やサービスを提供したいと思っています。もちろん可能であれば、コストパフォーマンスよくこれらを同時に叶えたいと考えています。

だからこそ、著しいコスト削減を可能にするコマーシャルオープンソースのソリューションを検討するのです。コスト以外では、Pentahoと商用BIベンダーとはどういった違いがあるのでしょうか?


ほとんどの場合、商用BIベンダーが提供するものはすべて同じようにみえます。表面的な部分は特にそうです。では、これらを差別化する基準とは何でしょう。

まず、これは私の習慣なのですが、不必要な機能や関数に惑わされないようにしています。その代わりに、そのBI環境が統合された現代的なアーキテクチャになっているかどうかを深く見ていくことをお勧めします。アーキテクチャはオンプレミスとクラウドの両方でセットアップできるものであることを推奨します。アジャイルデプロイメントを含む要素では、使いやすさとスケーラビリティが主な要素になります。その他の点では、サービス、サポート、付帯事項やトレーニング関連の違いが含まれます。単一のプラットフォームでしか使用せず、IT部門でしか変更できない魅力的なダッシュボードにどんな意味があるでしょうか?

これらを踏まえると、そのBIソリューションがあなたの本来の目的を満たしてくれるかどうかによって製品を決めるべきだと思います。ことわざにあるようにBeauty is only skin deep(外見の美しさなど皮ほどのものである。)ということなのです。


全体像をはっきりさせるために、いくつかの用語についてブレークダウンしていきましょう。

最初に「ビジネスインテリジェンス」という言葉について簡単に説明します。

一般に、ビジネスインテリジェンスという用語は新しいものではありません。私が生まれるよりもっと前から存在しています。BIとは製品でもシステムでもなく、プロジェクトではない活動であると考えられます。この用語はアーキテクチャ、アプリケーション、データベース、そしてそれらを使用する時の活動と結びつきます。1958年、IBMの研究者であるHans Peter Luhnが論文の中でbusiness intelligence(ビジネスインテリジェンス)という単語を使用しました。彼は「望む目的のために行動を導くように、そこにある事実の相互関係を理解する活動である。」と定義しています。1989Howard Dresner(後にガートナー・グループのアナリスト)はBIを「事実に基づいたサポートシステムを使用することで、業務の意思決定を改善する概念と手法」を表す包括的な用語として提案しました。この用法は1990年代後半までには広まり、およそ20年後の現在の世の中では、ビジネスインテリジェンステクノロジーは日に日に一般的なものになってきています。

次に「アジャイル- Agile-」という言葉についてです。まず名詞として、次に形容詞として見ていきます。アジャイルソフトウェア開発とは、反復型開発に基づいたソフトウェアのメソドロジー(方法論)です。IT部門、ビジネス部門または他のクロス機能のチーム間のコラボレーションを通して、要求とその解決法を進化させます。形容詞としての「アジャイル- Agile -」は単に、少ない労力で素早く移動することを意味しています。

この二つの単語を組み合わせたアジャイル・ビジネスインテリジェンスとは、ビジネスインテリジェンスを使用するユーザーとのコラボレーションをしつつ、ビジネスインテリジェンスアプリケーションの開発をアクティブに、素早く、簡単に、繰り返し行うことを指します。


PentahoのアジャイルBIは、ユーザーからの増えていくニーズにもっと対応できるようにさらに多様なスキルを持った開発者を増やしていくことにつながります。これによって情報が消費され、消費される方法も短い時間で修正されることは確実です。

PentahoアジャイルBIは、アクティビティの基盤として提供される一つに統合されたデプロイメント環境のもとで、ETL(データの移動と変換)、Visualization(データの視覚化)、そしてData Modeling(ビジネスレイヤの構築)をまとめて提供します。この方法論の適用はユーザーと開発者の両方にとって大きなメリットがあり、結果的にBIの成功を確実にします。

 ビジネスインテリジェンスとアジャイルデプロイメントは新しい概念ではありません。しかしこれらを組み合わせると組織・企業に効果的なBIアプリケーションを提供することが可能なのです。


★Have a nice Open Source Day★
KSKソリューションズ Pentahoチーム


と聞かれることが時々あります。というのも、「オープンソース」 = 「コミュニティ組織」 = 「ボランティアの開発者たちの集まり」、といったことを連想されるためです。

Pentahoは、2004年に米国フロリダのオーランドで設立された株式会社(Pentaho Corporation)です。ビジネスオブジェクツ、コグノス、ハイペリオン、Jboss、Oracle、SAS等の商用BIベンダー出身者と、Kettle(ETL)、Mondrian(OLAP)、JfreeReports(レポート)等のオープンソースPJのアーキテクトたちが集まり、2005年にバージョン1がリリースされました。2010年、Pentahoはバージョン4となり、BI商用製品を凌駕する品質・機能を備えるまでになっています。

Pentahoは、2つの顔を持っています。「営利企業」の顔と「オープンソースコミュニティ」としての顔です。

 

  • 「営利企業」(pentaho.com)としてのPentaho:

Pentahoは利益を追求する株式会社です。ベンチャーキャピタルからも多く出資を受け、企業としても注目されています。最近も4thラウンドでの7億円の増資を受け、合計約30億円の資本を有しています。 R&Dに多額の投資を行い、商用版に匹敵する機能を短期間で開発しています。 導入企業はワールドワイドで8000社を超えました。

 

  • 「オープンソースコミュニティ」(pentaho.org)としてのPentaho:

Pentahoは、ソースコードをコミュニティに公開するオープンソース・プロジェクトです。GPL(LGPL)ライセンスの元で配布されています。このノーガード戦法とも言えるオープン性は、下記のようなベネフィットを提供します。

ユーザーに対して、低コストでBIシステムを構築できる(商用BIツールは特に高い)、特定のベンダーによるロックインから逃れられる。

開発者に対して、Pentahoに対応するプラグインや付加機能の開発の誘引となる。(BIは特にカバーすべき範囲が広い)、コミュニティが活性化し、その中でナレッジや機能要望などが洗練されていく。(Pentahoファンの増加)

Pentahoにとって、多額の広告宣伝費を投じなくても、ターゲットとなるユーザーが自らダウンロードし、評価してくれる。他のJava系のオープンソースを組み入れることで開発がスピードアップする。

 

  •  Pentahoの人々:

上記のような2つを顔を持ち、Pentahoメンバーも「商用BIベンダー出身者」と「OSSコミュニティ出身者」に分かれるため、Pentahoの社内カルチャーはハイブリッドなものです。弊社もセールス面、技術面でPentahoとやり取りを行いますが、ある技術者が入社時のこんなジョークを教えてくれました。

 

トーマス・・・Pentahoレポーティングのチーフ開発者・Jfreeレポートの創始者

カーティス・・・レポートデザイナー3.5の開発者・ハイペリオン出身

 

トーマス:「Kurtis、今度君には新しいレポートデザイナー3.5の開発を担当してもらうよ。

       じゃあ、これについてミーティングを始めよう。まずeclipse(エクリプス)を起動してくれ。」

カーティス:「eclipse(エクリプス)って、何ですか?」

トーマス:「Ohhh」

 

 ハイペリオン出身の彼はオープンソースとはまったく無縁の生活を送っていたので、戸惑うことが多かったそうです。ただこうした異質なバックグランドを持つ人たちの集まりは、Pentahoのコンピタンスの一つとなっているのは間違いありません。

 

 参考:Pentahoを作っている人たちです。Pentahoの社長(Richard)はじめ、ほぼオールキャストで出演です。

 

 

 

2014年4月

    1 2 3 4 5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28 29 30