Enjoy Data Mining!

データマイニング手法やデータマイニングツールの使用法などの備忘録

データマイニング概論

Wekaで分析するためのデータの準備

Wekaを用いたデータの準備をする際,「どのようなデータを用意すべきか」で頭を悩ませることが多いと思います. 今回は,3つの観点からデータの準備について,説明していきます. データの内容 Wekaで利用可能な機械学習アルゴリズム(一部,回帰分析などの…

分類モデルの選定について

何らかのデータがあって,データに基づいて自動的に分類を行いたい場合,分類学習アルゴリズムによる分類予測(識別・判別などと呼ぶこともあり)を行うことが可能です. このとき,目的によって分類学習アルゴリズムの適用結果である分類モデルの性質に気を…

データマイニングが登場した背景

データマイニングの登場には,情報通信や計算機技術の発展が強く関係しています.特にデータの集積に関しては,計算機の性能が向上し,補助記憶装置(ハードディスク)などの記録装置の容量も飛躍的に向上したことにより,容易に蓄積が可能になってきました…

データマイニングのプロセス

データマイニングが提唱されたと同時に,データの準備から規則性(パタン)の生成,評価から経済活動や研究活動といった現場にデータベースに保存されたデータから得た知識を報告するまでに至るプロセスが提唱されました.このプロセスは,蓄積されたデータ…

データマイニングとは(2)

データマイニングとは,呪文のように「データベースからの有益で未知なパタン(知識)の発見」とか,従来のデータ分析技術を統合した枠組み,というように唱えていても,なかなか現実にピンとこないと思います.過去の事実(蓄積されたデータ)から規則性を…

データマイニングとは

データマイニングとは,1990年代後半にかけて,データ分析のありかたを整理した概念として提唱された言葉です.当初の「データマイニング」の定義は,「データに内在する未知で有用な規則性(パタン)を見出すこと」であり,様々な要素技術から成る一連のプ…