Pentaho Datamining: 2011年3月アーカイブ

前回ポストでご紹介したPentahoデータマイニング(weka)日本語版ですが、弊社サイトから実行形式のものをダウンロードいただけるようにしました。一足先に日本語版のwekaを使用したいという方はどうぞ。「体験版ダウンロード依頼」はPentaho日本語サイトより可能です。

また4月5日(火)13:30-16:00に、品川イーストワンタワーでPentaho無料紹介セミナーを開催致します。Wekaを用いたビジネスアナリティクスやデータマイニングのセッションもあります。ぜひご参加ください。


★Have a Great Open Source Day★
KSKソリューションズ Pentahoチーム
www.pentaho-partner.jp
またまたPentahoデータマイニング関連のポストとなります。よくいただく質問に「日本語の属性やデータが文字化けする」というものがあります。

多くの場合、これはエンコード設定の問題です。以下に手順を記載します。

【日本語文字化けの解消:エンコードの変更】
1.WekaインストールディレクトリのRunWeka.iniをテキストエディター等で開きます。
2.下記のようにデフォルトのエンコード(Cp1252)をコメントアウトし、「fileEncoding=utf-8」を記載します。

weka_runwekaini.jpg


3.ファイルを上書き保存し、Wekaを再起動します。
4.arffファイルやcsvファイルを読み込んでみましょう。(読込ファイルのエンコードはutf-8である必要があります。)日本語属性が表示されます。

weka_attributes.jpg





★Have a Great Open Source Day★
KSKソリューションズ Pentahoチーム
www.pentaho-partner.jp


Weka (Pentaho Data Mining) 日本語化

|
KSKソリューションズでは、データマイニングのオープンソースソフトウェアWeka(Pentaho Data Mining) の多言語対応と日本語化を行い、Wekaプロジェクトに寄贈しました。

【従来の問題点】
Wekaは、ニュージーランドのワイカト大学を中心に開発が進められるオープンソースのデータマイニングプロジェクトです。アカデミックでは、データマイニングソフトウェアとして普及が進んでいます。しかし、GUIのローカライズはあまり考慮されておらず、Pentahoの他のソフトウェアのようにプロパティファイルによる多言語対応がされていませんでした。

【弊社で行ったこと】
KSKソリューションズでは、Wekaで多言語表示が行えるようにソースコードを改編し、外部プロパティファイルを設置して、GUI表示をコントロールできるようにしました。併せて、GUIの日本語化を行い、Wekaプロジェクトに寄贈しました。(Ver3.6.3に対応)


weka_menu.PNG


weka_explorer.PNG


weka_decision_tree.PNG

【今後の対応】
今後この改善により、多言語での対応が可能になります。KSKソリューションズでは、引き続きWeka(Pentahoデータマイニング)のローカライズを実施していきます。Pentahoデータマイニングについてのサポート、コンサルティング等も積極的に行ってまいります。詳細のご質問・ご要望は、Pentaho日本語サイトよりお問い合わせください。

現在弊社では、Wekaを含むオープンソースでのビジネスアナリティクス・統計解析・データマイニングを進めるためのデータアナリストやビジネスパートナーを募集しております。ご興味がございましたら、ぜひお問い合わせください。

★Have a Great Open Source Day★
KSKソリューションズ Pentahoチーム

2014年4月

    1 2 3 4 5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28 29 30      

2011年10月: 月別アーカイブ