ETL
Pentahoデータ統合(ETL)
データはいたるところに存在します。すべての情報を一元管理することは、今日の組織が直面する大きな課題の1つです。 Pentaho データ統合(ETL)は、強力な抽出(Extraction)、変換(Transformation)、ロード(Loading)技術を提供します。 直観的でグラフィカルなドラッグアンドドロップのデザイン環境とスケーラブルで標準的なアーキテクチャーで、高い生産性を実現します。
Pentaho アジャイル BI のアプローチを利用することで、開発者とエンドユーザーがシームレスにひとつの統合環境の中で作業できます。 これによりBI 開発者やエンドユーザーは、素早く簡単、かつ低コストに BI アプリケーションを構築できます。 Pentaho データ統合は、強力なETLに加えて、これらに必要なモデリング、ビジュアライズプロセスを提供しています。
Pentaho アジャイル BI
- 素早く、インタラクティブに BI アプリケーションを開発することが可能です
- 開発者とエンドユーザーの間でシームレスなコラボレーションを可能にします
- 複雑な BI 開発を一度のプロセスでマージします
- 時間コストや構築の複雑さ、BI アプリケーション開発の煩わしさを激減させます
Pentaho データ統合は、フル機能のETLソリューション
Pentaho データ統合のメタデータによるアプローチは、作成するために「どのように」を指定するのではなく、「何を」を指定するだけです。 ETL と BI 開発者と管理者は、まったくカスタムコードを生成することなく、ドラッグアンドドロップとグラフィカル環境のみで複雑なデータ変換やジョブを作成することができます。
- 150以上の独創的なマッピングオブジェクトの豪華なデータ変換ライブラリです
- 30以上のオープンソースや商用のデータベースプラットフォーム、フラットファイル、Excelドキュメントなどのデータソースを幅広くサポートしています
- Hadoop データの統合と管理による大容量データ分析をサポートしています
- Slowly Changing Dimensions や Junk Dimensions といった先進のデータウェアハウスをサポートしています
※ Slowly Changing Dimensions とは、Aさんが引っ越して住所が別の都道府県に変わった場合など、どのようにデータを更新するかといった方法のことです。 基本的にタイプ0から4まであり(さらにハイブリッドがある)、更新の方法はデータウェアハウスの設計に非常に重要な概念です。
※ Junk Dimensions とは、フラグやインジケータをファクトテーブルから取り除き、その他ディメンジョンにしたディメンジョンのことです。 - 証明されたエンタープライズクラスの性能とスケーラビリティ
- 企業内情報統合(EII)、スケジューリングとプロセス統合のためのPentaho BI スイートによる統合
- BI アプリケーションをデザインするための ETL とモデリング、ビジョアライズ開発環境の一体化
Pentaho データ変換の使用例
- データウェアハウスへのデータ投入
- BI アプリケーションのアジャイル開発
- Hadoop と従来の構造化されたデータを組み合わせた大容量データ分析
- 様々なソースからデータ統合することによる情報強化
- アプリケーション間のデータマイグレーション
- テキストファイル、Excelスプレッドシート、リレーショナルシステムなどからデータベースへのデータインポート
- データ変換で複雑な条件を適用したデータクレンジング
- 既存データベースのデータの検索(テーブル、ビューなど)

