2016-6-26_7-31-41_No-00

データ解析・分析するとき、基本的に最初にすべきことはデータの見える化・可視化です。

データの見える化・可視化ってそもそも何?

よく、『データの見える化』とか『データの可視化』とかを言われるようになってきたり、いろいろなところで目にすることが多くなってしました。ただ、データの見える化・可視化について、具体的にどういうことか正確に答えられる人は少ないです。

データの見える化・可視化とは、

  • 多次元空間に存在しているデータセットを、情報量の損失が小さいように2次元もしくは3次元 (主に2次元) 空間に変換すること

です。ちょっとわかりにくいですよねw

なので、具体例を交えながらわかりやすくデータの見える化・可視化を説明していきましょう。

影あそび

両手で握手するみたいにして、その影を見ると犬っぽく見えるってやりませんでしたか?他のもいろいろな影あそびがあります。あれは、3次元の両手を、影という2次元に『見える化・可視化』したってことです。

身長と体重

これもデータの見える化・可視化の例として使われることが多いです。人の身長と体重です。いろいろな人の身長と体重のデータを集めると、だいたい身長が高い人は体重も高いですね。このようにある傾向があるときに、データの見える化・可視化は有効です。

ここでは、いろいろな人が『身長』・『体重』という たった2次元で表されていますので、すでに見える化・可視化が達成されています。ただ、データの見える化・可視化の例として、ここでは2次元を1次元に変換することを考えましょう (4次元以上を2,3次元に変換するのと同じことです)。

では、『身長』・『体重』という2次元のデータセット (たくさんの人) を、『(身長)+(体重)』という1次元に変換します。1次元ですが、『身長』が同じ人でも『体重』が異なれば区別がつきますよね。逆に『体重』が同じでも『身長』が異なれば区別がつきます。このように、

  • 『身長』だけ
  • 『体重』だけ

といった同じ1次元と比べて

  • 『(身長)+(体重)』

という一次元のほうがよりたくさんの人を区別できています。『情報量の損失が小さい』というのはこういうことです。

地球の地図

わたしたちが暮らしている地球の表面 全体を見たいとき、一番見やすいのは地球儀です。くるくる回しながら地球全体を確認できます。

ただ、地理の教科書に地球の地図をのせたいときなど、2次元で表さなくてはなりません。

このように、3次元の地球の表面データを、2次元に変換するのも、データの見える化・可視化です。

完璧なデータの見える化・可視化なんてない!

データの見える化・可視化のイメージは伝わりましたか?基本的には、データ解析・分析の第一歩は、このデータの見える化・可視化です。解析・分析したいデータセットがありましたら、必ず最初にデータの見える化・可視化を行いましょう。

では最後に、データの見える化・可視化をするときの注意点です。それは、

  • 完璧なデータの見える化・可視化なんてない!

ってことです。もう少しかみ砕いて説明すると、

  • 実際は (見える化・可視化する前は) 近いサンプル同士でも、見える化・可視化したあとに遠くなってしまうことがある
  • 見える化・可視化したあとに近いサンプル同士でも、実際は遠いことがある

ということです。

1. について、地球の地図で説明しましょう。2次元の地球の地図において、右端と左端は実際の地球上ではつながっていますよね。でも2次元の地図上では離れてしまっています。実際は近いですが、見える化・可視化したあとに遠くなってしまう例です。これはおかしいですね。

2. について、身長と体重で説明しましょう。たとえば、下のようなAさんとBさんがいたとします。

  • Aさん:身長が 170cm、体重が 60kg
  • Bさん:身長が 130cm、体重が 100kg

このとき、二人とも『(身長)+(体重)』は230ですが、まったく違う人 (体型) ですよね。可視化・見える化したあとに近いですが、実際は遠い例です。これもおかしいですね。

このように、見える化・可視化したあとおかしなことが起こることもあります。こうしたことを念頭に入れた上で、見える化・可視化した結果を検討しましょう。

この辺りのことについてはこちらの記事も参考になります。

データの見える化・可視化をした結果を解釈するときに必要なたった1つのこと

まとめ

データの見える化・可視化のいくつかの例・イメージと、最後に注意点について紹介しました。データの見える化・可視化の例については、他の人に説明するときにも、ぜひ使ってみてください。

また実際にデータの見える化・可視化をしたあとは、注意点で説明したことに気をつけながら結果を見るようにしましょう。

ご案内。

オススメ記事セレクション。

twitterでも発信中。

フォローしていただけると嬉しいです。


無料メルマガでブログにない情報を配信中。

無料メルマガの登録はこちら