2016-6-29_21-29-23_No-00

ICAって、PCAと似てますよね。違いといえば、

  1. PCA:成分の間の関係は無相関
    ICA:成分の間の関係は独立
  2. PCA:寄与率の順に成分が並ぶ
    ICA:成分の間に優劣はない

くらいです。なので実際は 2. のように、ICAを行ったけど結局どの成分を使えばいいの?ICA使いにくい! ってなります。なので、一般的にはICAは使いにくい手法の一つです。

でも、ICAはちゃんと使う場面を考えて使えば非常に有用な手法です。そこで今回は、どんなときにICAを使えばよいのか、説明します。具体的には以下の2つです。

  • 雑音を含む信号から、雑音以外の独立した信号を取り出したいとき
  • 外れ値を検出したいとき

順に説明します。

雑音を含む信号から、雑音以外の独立した信号を取り出したいとき

ICAは音やスペクトルなどの信号処理の分野で開発された手法です。なのでやっぱり、この分野で使われることが多いです。

ICAではカクテルパーティー効果を実現できます。つまり、ICAは雑音などいろいろな信号が混ざった信号から、雑音を含む独立な信号を取り出すことができます。なので、取り出したい信号が互いに独立であれば、そのような独立した信号を、いろいろと混合された信号の中からICAによって抽出できるわけです。

またスペクトル解析・分析の分野では、いろいろな成分が混ざった物質のスペクトルから、独立なスペクトルを抽出することに使われます。さらに時系列データ解析・分析の分野では、いろいろな変動の要因がまざって観測された時系列データから、独立した変動の情報を取り出すことに使われます。

外れ値を検出したいとき

ICAによって取り出された成分は外れ値に敏感です。

まずその理由を説明します。ICAにおける独立性の指標に、尖度 (kurtosis) があります。尖度とは、データの分布がどれだけ尖っているか、の指標です。ちょうど正規分布のときに0になり、それより分布が平べったいと負の値になり、逆に分布がとんがっていると正の値が大きくなります。ICAでは、この尖度の値が最小になる、もしくは最大になる成分が、独立成分として抽出されます。外れ値があるときは、尖度の値が大きくなりますので、そのような成分は独立成分として抽出されやすい、ということです。

なので、独立成分を計算したあとに、各独立成分の尖度の値を確認し、その値がもっとも大きい独立成分を見れば、外れ値を見つけられる可能性が高いです。このようにICAを用いることで、効率的に外れ値を見つけることができます。

まとめ

ICAを効果的に使う場面として、

  • 雑音を含む信号から、雑音以外の独立した信号を取り出したいとき
  • 外れ値を検出したいとき

ということを説明しました。みなさんもICAをうまく活用することで効率的にデータ解析・分析しましょう!

ご案内。

オススメ記事セレクション。

twitterでも発信中。

フォローしていただけると嬉しいです。


無料メルマガでブログにない情報を配信中。

無料メルマガの登録はこちら