2016-8-1_19-52-28_No-00

データ解析の手順』 における「3. 外れ値処理・変数処理・ノイズ処理を行う」についてです。なお実行するためのプログラムについてはこちらをご覧ください。

公開中のプログラム・コード一覧(実用的かつ実践的なデータ解析・機械学習・データマイニング) : 大学教授のブログ

[New] RSTのプログラムを簡単に入手できるようになりました!

それぞれのURLからお求めください!

R: https://spike.cc/shop/univprof/products/DXDyag01

Rough Set Theory (RST)

Rough Set Theory (RST) により、離散的な目的変数を適切に分類できる変数の組み合わせおよび、分類するためのルールを得ることができます。

RSTによる変数選択は下の手順で行われます。

  1. データセットを離散化する
    連続値のデータではRSTの計算ができないため注意が必要です。均等に離散化する方法や、四分位数で離散化する方法や、目的変数を考慮して分類しやすいように離散化する方法があります。
  2. RSTを実行する
    大きく分けると、
    ・decision tableの作成
    ・discernibility matrixの作成
    ・reductの計算
    ・reductの選択
    ・選択されたreductによるdecision tableの作成
    ・選択されたreductによるdiscernibility matrixの作成
    ・ルールの導出
    になります。
    なおreductが選択された変数に対応します。

ご案内。

オススメ記事セレクション。

twitterでも発信中。

この記事に興味を持っていただけましたら、ぜひフォローをお願いします!


無料メルマガでブログにない情報を配信中。

データ解析・分析に興味がありましたらぜひ登録をお願いします!
無料メルマガの登録はこちら