データマイニング

Pentaho データマイニング(Weka)

Pentaho は、データ統合、OLAP、レポーティング、分析機能に加えて、最新のデータマイニングや統計解析機能を提供します。 データマイニングは、標準的な分析やレポートからは分からない重要なパターンや相関関係を最新のアルゴリズムによって見つけます。 データマイニングによって、ビジネスをさらによく理解することができ、予測を活用することでパフォーマンスを向上させることができます。 例えば、データマイニングは類似した顧客の特徴の解析に基づいて、期限通りに支払いが行われない可能性が高い特定の顧客を警告します。

Pentaho データマイニングは、 Weka データマイニング技術を使用しており、オープンでスタンダードな特徴を持ちます。 Pentaho BI スイートエンタープライズエディションとは区別されますが、 Pentaho BI スイートエンタープライズエディションのレポーティング、アナリシス、ダッシュボードを含むコアのBI機能と統合します。

weka_01.jpg

Pentaho データマイニングとは

  • 分析者がすぐに使用可能な追加設定の必要のないソリューションです。
  • データマイニングは、完全にバックグラウンドで動作し、Eメールや他のウェブページを通して結果とアドバイスを確認できます。 また、Pentaho ダッシュボードに組み込むことが可能です。
  • Java 開発者が Java オブジェクトや JSP を使って簡単にカスタムレポートソリューションを作ることができるコンポーネントセットです。 他のアプリケーションやポータルと統合できます。

Pentaho データマイニング(Weka)の特徴

  • データに隠れたパターンと関係性を導き出します
  • 相関関係を見つけ出し、組織のパフォーマンスを向上させます
  • 未来の意思決定に必要な指標を提供します
  • アプリケーションにアドバイスを埋め込むことができます
  • 様々なデータマイニングのアルゴリズムをフルに活用できます

特徴と機能

  • Weka プロジェクトから、クラスタリング、セグメンテーション、決定木、ランダムフォレスト、ニューラルネットワーク、 主成分分析を含む 機械学習アルゴリズムの総合的なセットを提供します。
  • アウトプットはグラフィカルに表示したり、プログラムで利用したり、レポートや分析、さらなるプロセスのデータソースとして利用できます。
  • フィルタは、離散化、標準化、リサンプリング、属性選択、変換や結合に対して用意されています。
  • 分類は、判別予測や数量予測するためのモデルを提供します。
  • 学習スキーマは、決定木やリスト、サポートベクターマシーン(SVM)、マルチレイヤーパーセプトロン(MLP)、ロジスティック回帰、ベイズネットなど、その他高度な技術を含んでいます。
  • 入出力はプログラムでコントロールできます。開発者は提供されたコンポーネントを使用して、完全なカスタムソリューションを作ることができます。

weka_02.jpg