Pentaho Data Integration (ETL)の最近のブログ記事

Image result for hadoop logoImage result for hadoop spark

ご要望の多かったPentahoデータ統合コースの続編 「PentahoとHadoopフレームワークの基本」(DI2000)を提供することになりました。まずは2017年8月3日-4日に開催しその後定期コースとして開催してまいります。、

Pentahoデータ統合(DI1000)の次のステップとして、Pentahoがどのように以下の Hadoop関連テクノロジーと連携するかを効果的に学習することができます。ビッグデータ統合を検討される方、ぜひご検討ください。

  • HDFS
  • Sqoop
  • Pig
  • Oozie
  • MapReduce
  • YARN
  • Hive
  • Impala
  • HBase
  • Flume
  • Spark

詳細は、PentahoとHadoopフレームワークの基本(DI2000)トレーニングページをご覧ください。







Pentaho7.1がリリースされました。今回のトピックスは以下です。 評価版もありますので、ぜひお試しください。

1.ビッグデータ対応、SPARKの完全サポート
SPARKに完全対応しました。PDI(Pentahoデータ統合)を使うことで、ドラッグ&ドロップの環境で、特別な技術知識のない方でも、SPARKを使ったデータ統合が可能になりました。

2.Microsoft Azure HDInsight
従来からの様々なクラウド環境に加えて、今回マイクロソフトのHDInsightに対応しました。

3.高度なデータ可視化
PDIでの様々なビジュアリゼーションが可能になりました。これによりデータ取得・変換・可視化までが素早く行えるようになっています。

4.Hortonworks Hadoopセキュリティ
ホートンワークスのHadoopセキュリティーに対応しました。具体的には、Kerberosインパーソネーションのサポート、Apache Rangerのサポートを行っています。





Pentaho7.0がリリースされました!

|
Pentaho1年ぶりのメジャーバージョンアップとなる7.0がリリースされて提供が始まりました。今回の主な強化ポイントは以下となります。




1.データ加工と分析の融合
PDI(Pentaho Data Integration)の可視化機能が進化し、データ統合を行いながら分析(可視化)を行ったり、可視化した結果をもとにデータ統合プロセスを見直したり、など加工~分析がやりやすくなりました。