Weka (Pentaho Data Mining) 日本語文字化けの解消

|
またまたPentahoデータマイニング関連のポストとなります。よくいただく質問に「日本語の属性やデータが文字化けする」というものがあります。

多くの場合、これはエンコード設定の問題です。以下に手順を記載します。

【日本語文字化けの解消:エンコードの変更】
1.WekaインストールディレクトリのRunWeka.iniをテキストエディター等で開きます。
2.下記のようにデフォルトのエンコード(Cp1252)をコメントアウトし、「fileEncoding=utf-8」を記載します。

weka_runwekaini.jpg


3.ファイルを上書き保存し、Wekaを再起動します。
4.arffファイルやcsvファイルを読み込んでみましょう。(読込ファイルのエンコードはutf-8である必要があります。)日本語属性が表示されます。

weka_attributes.jpg





★Have a Great Open Source Day★
KSKソリューションズ Pentahoチーム
www.pentaho-partner.jp


2014年4月

    1 2 3 4 5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28 29 30