Weka (Pentaho Data Mining) 日本語文字化けの解消

|
またまたPentahoデータマイニング関連のポストとなります。よくいただく質問に「日本語の属性やデータが文字化けする」というものがあります。

多くの場合、これはエンコード設定の問題です。以下に手順を記載します。

【日本語文字化けの解消:エンコードの変更】
1.WekaインストールディレクトリのRunWeka.iniをテキストエディター等で開きます。
2.下記のようにデフォルトのエンコード(Cp1252)をコメントアウトし、「fileEncoding=utf-8」を記載します。

weka_runwekaini.jpg


3.ファイルを上書き保存し、Wekaを再起動します。
4.arffファイルやcsvファイルを読み込んでみましょう。(読込ファイルのエンコードはutf-8である必要があります。)日本語属性が表示されます。

weka_attributes.jpg





★Have a Great Open Source Day★
KSKソリューションズ Pentahoチーム
www.pentaho-partner.jp