Pentaho Data Integration(Kettle)のカスタマイズ開発-Yahoo!形態素解析ステップ

| | コメント(0) | トラックバック(0)
Pentahoデータ統合ツールには、豊富なステップが用意されており、通常のETLロジック作成で困ることはありません。しかし、まれに「こういうことができないか」「こういう処理を行いたい」等のリクエストをお客様よりいただきます。Pentahoデータ統合ツールは、オープンソースですので独自にステップを作成して追加することが可能です。

以下、KSKソリューションズで作成した形態素解析用ステップの例です。

【課題】ブログやTwitterなどの文章を取り込んで、テキストマイニングやキーワード分析をするためのデータを構築したい。

【ソリューション】Yahoo!形態素解析と連携し、分かち書きされ、品詞タイプとともにデータとして取り込むステップ(プラグイン)を開発。

1.KSK Solutions>Yahoo! API Pluginを追加
pdi_yahoo_1.JPG


2.ファイルにURLと分析対象文章を入力。(前のステップから取り込むことも可能)
pdi_yahoo_2.JPG


3.XMLパスを設定
pdi_yahoo_3.JPG


4.フィールドを設定
pdi_yahoo_4.JPG


5.データ取得プレビュー
pdi_yahoo_5.JPG



★Have a Great Open Source Day★
KSKソリューションズ Pentahoチーム






トラックバック(0)

このブログ記事を参照しているブログ一覧: Pentaho Data Integration(Kettle)のカスタマイズ開発-Yahoo!形態素解析ステップ

このブログ記事に対するトラックバックURL: http://www.pentaho-partner.jp/mt/mt-tb.cgi/159

コメントする