2016-05-30_22h48_14

データ解析の手順』 における「5.回帰モデルもしくはクラス分類モデルを作る」についてです。なお実行するためのプログラムについてはこちらをご覧ください。

公開中のプログラム・コード一覧(実用的かつ実践的なデータ解析・機械学習・データマイニング) : 大学教授のブログ

[New] SVRのプログラムを簡単に入手できるようになりました!

それぞれのURLからお求めください!

MATLAB: https://spike.cc/shop/univprof/products/mytTqIm9

R: https://spike.cc/shop/univprof/products/wkpFTzJq

Python: https://spike.cc/shop/univprof/products/X67mbOKm

線形判別分析 (Linear Discriminant Analysis, LDA)

線形判別分析 (Linear Discriminant Analysis, LDA)によりクラス分類モデルを構築できます。LDAでは、サポートベクターマシン (Support Vector Machine, SVM) のCやγのようなクロスバリデーションで決めなければならないパラメータはありません。そのためとてもシンプルに実行できます。

  1. 説明変数をオートスケーリングする
    オートスケーリングとは各変数から平均値を引いて平均を0にし、各変数を標準偏差で割って標準偏差を1にする操作です。
  2. LDAモデルを構築する
  3. 目的変数の計算値と実測値との間で混同行列を計算する
  4. 必要に応じて混同行列から正解率・検出率・精度などを計算する
  5. [新しいデータの推定をするとき] 説明変数の新しいデータから、オートスケーリングした時の説明変数の平均値を引き、標準偏差で割る
  6. [新しいデータの推定をするとき] 上の2.で得られたLDAモデルにより目的変数の推定値を計算する

新しいデータを推定する際に工夫が必要なのは、最終的に得られたLDAモデルは、説明変数がオートスケーリングされた後のモデルであるためです。

そこで、新しく推定したい説明変数のデータがあれば、そのデータからオートスケーリングした時の説明変数の平均値を引き、標準偏差で割ってから、LDAモデルにより目的変数の推定値を計算する必要があります。

[LDAの参考書はこちら]