Enjoy Data Mining!

データマイニング手法やデータマイニングツールの使用法などの備忘録

2010-01-01から1年間の記事一覧

CSVデータの読み込みと書き出し

WekaをMicrosoft Excelなどの表計算ソフトと連携するとき,ファイル形式の不一致が問題になることがあります. 少しずつですが,Wekaで扱えるファイル形式も増えてきていますが,現在のところExcelなどの商用ソフトの独自形式は直接読み込めません. この場…

コマンドラインでのWekaの利用法(その1)

Wekaは,ExplorerやKnowledge FlowなどのGUIを通しての利用だけではなく,通常のJavaクラスと同様にAPIやコマンドラインからも利用可能です. Perlなどのスクリプト言語から,複数の訓練データやテストデータを指定して同じアルゴリズムを実行するのに便利で…

属性の設定について

データマイニングでは教師あり学習アプローチで数値予測や分類予測を行う問題を扱うことがあります. また,そうでなくても属性-値のペアで連関のあるものを見出すこともあります. このような問題を扱うとき,決定木,回帰木,数値予測モデル,if-then形式…

再開してみました

以前,どこからもリンクを張らずに開設していたブログをはてなに引っ越ししました. データマイニングに関する内容を少しづつアップしていく予定です.ノートPCも新しいものに引っ越したので,心機一転がんばって1日1記事を目指したいと思います. ...…