こんにちは!大学教員ブロガーのねこしです。
『データ解析の手順』における
「2. データを見える化 (可視化) する」
についてです。なお実行するためのプログラムについてはこちらをご覧ください。
FAを実行できるプログラムを簡単に入手できます!
それぞれのURLからお求めください!noteでもSPIKEでも言語が同じであれば同じものです。
MATLAB: note SPIKE
R: note SPIKE
Python: note SPIKE
因子分析(Factor Analysis, FA)
因子分析(Factor Analysis, FA)は、データセットの次元を削減したり、データセットの中に潜む共通の因子を抽出したりするための手法です。次元を2まで減らすと可視化・見える化できることになります。
FAの詳細と主成分分析(Principal Component Analysis, PCA)との違いについてはこちらをご覧ください。
主成分分析(Principal Component Analysis, PCA) ...
FAは以下の手順で行います。
- 共通因子の数を決める
この数が2のときはデータセットを可視化できることになります。 - オートスケーリングを行う
オートスケーリングとは各変数から平均値を引いて平均を0にし、各変数を標準偏差で割って標準偏差を1にする操作です。特別な理由がない限りは行うようにしましょう。 - FAを実行する
- 共通因子・因子負荷を確認する
- (可視化の場合)共通因子間のプロットを確認する
ここまでお読みいただきありがとうございます。ぜひ上のFAのプログラムもご活用ください。プログラムは上の順序で実行するようになっていますので、1.の共通因子の数を変更することで、色々なFAが可能になります。
これを書いた人
note : https://note.mu/univprof
twitter:https://twitter.com/univprofblog1
ぜひフォローをお願い致します。
データ解析の質問 募集中!
こちらへお願いします!
ご案内。
オススメ記事セレクション。
- 20人の学生に対する研究テーマの決め方
- 学会・会議・講演会・勉強会における3つの良い質問と2つの悪い質問
- 大学教員の5つのメリット (とデメリット?)
- 現役データサイエンティストへの『人工知能って怖いの?』に対する回答
- 人工知能との未来における人の役割~現役のデータサイエンティストのメッセージ~
- 集中する時間を確保するために大学教授が行っている8つのこと
twitterでも発信中。
この記事に興味を持っていただけましたら、ぜひフォローをお願いします!
Follow @univprofblog1Tweets by univprofblog1