SnapCrab_2017-3-5_8-31-41_No-00

こんにちは!大学教員ブロガーのねこしです。

データ解析の手順』における
「2. データを見える化 (可視化) する
についてです。なお実行するためのプログラムについてはこちらをご覧ください。

公開中のプログラム・コード一覧(実用的かつ実践的なデータ解析・機械学習・データマイニング) : 大学教授のブログ (データ分析相談所)

FAを実行できるプログラムを簡単に入手できます!

それぞれのURLからお求めください!noteでもSPIKEでも言語が同じであれば同じものです。

MATLAB: note SPIKE

R: note SPIKE

Python: note SPIKE

因子分析(Factor Analysis, FA)

因子分析(Factor Analysis, FA)は、データセットの次元を削減したり、データセットの中に潜む共通の因子を抽出したりするための手法です。次元を2まで減らすと可視化・見える化できることになります。

FAの詳細と主成分分析(Principal Component Analysis, PCA)との違いについてはこちらをご覧ください。

結局、主成分分析と因子分析って何が違うの? たった3つの違いを押さえるだけで比較はOKです : 大学教授のブログ (データ分析相談所)
主成分分析(Principal Component Analysis, PCA) ...

FAは以下の手順で行います。

  1. 共通因子の数を決める
    この数が2のときはデータセットを可視化できることになります。
  2. オートスケーリングを行う
    オートスケーリングとは各変数から平均値を引いて平均を0にし、各変数を標準偏差で割って標準偏差を1にする操作です。特別な理由がない限りは行うようにしましょう。
  3. FAを実行する
  4. 共通因子・因子負荷を確認する
  5. (可視化の場合)共通因子間のプロットを確認する

ここまでお読みいただきありがとうございます。ぜひ上のFAのプログラムもご活用ください。プログラムは上の順序で実行するようになっていますので、1.の共通因子の数を変更することで、色々なFAが可能になります。

これを書いた人

ブログ:http://univprof.com/

note : https://note.mu/univprof

コード・プログラムのショップ : https://spike.cc/shop/univprof

twitter:https://twitter.com/univprofblog1

ぜひフォローをお願い致します。

データ解析の質問 募集中!

こちらへお願いします!

ご案内。

オススメ記事セレクション。

twitterでも発信中。

この記事に興味を持っていただけましたら、ぜひフォローをお願いします!