Enjoy Data Mining!

データマイニング手法やデータマイニングツールの使用法などの備忘録

Weka

Wekaで分析するためのデータの準備

Wekaを用いたデータの準備をする際,「どのようなデータを用意すべきか」で頭を悩ませることが多いと思います. 今回は,3つの観点からデータの準備について,説明していきます. データの内容 Wekaで利用可能な機械学習アルゴリズム(一部,回帰分析などの…

決定木から分類ルール集合への変換

決定木は,根から葉に至る経路が条件分岐からなっていて,訓練データのデータを葉に割り当てていく上で尤もらしくなる過程を表しています. この過程を用いて,節と枝に与えられら属性と関係演算子と値を組み合わせて条件節,葉に割り当てられたクラスを結論…

CSVデータの読み込みと書き出し

WekaをMicrosoft Excelなどの表計算ソフトと連携するとき,ファイル形式の不一致が問題になることがあります. 少しずつですが,Wekaで扱えるファイル形式も増えてきていますが,現在のところExcelなどの商用ソフトの独自形式は直接読み込めません. この場…

コマンドラインでのWekaの利用法(その1)

Wekaは,ExplorerやKnowledge FlowなどのGUIを通しての利用だけではなく,通常のJavaクラスと同様にAPIやコマンドラインからも利用可能です. Perlなどのスクリプト言語から,複数の訓練データやテストデータを指定して同じアルゴリズムを実行するのに便利で…