『お前は何やらせてもダメだな!』って人格もろとも全否定する人っていますよね。何様?って感じです。その人の何が分かるの?って思います。
すべての人について、その人の人格はまったく悪くありません。もし人が仕事を正しくやらなかったり、何度言っても直してくれなかったり、何かよくないことをしているのだとしたら、その人の習慣が悪いだけです。
実は、データサイエンスの分野でもこれ同じようなことがあるんです。
解析手法は悪くない
データサイエンスの分野でも、SVRは使えないとか、ディープラーニングは予測性能が低いとか、手法を否定する人がいます。これはよくありません。
こういうときはたいてい、それぞれの手法をあまり検討せずに、使えないとか性能が低いとか結論づけています。
ハイパーパラメータの値が悪い
もちろん手法ごとに、メリットだけでなくデメリットもあります。ただ重要なことは、手法自体は悪くなく、その手法を使うときに設定すべきハイパーパラメータの値が悪い、ということです。手法を否定している人のほとんどはハイパーパラメータの値を検討せずに、使えない、とか言ったりします。そりゃ、ハイパーパラメータの値を最適化しなきゃどんな手法も使えないでしょ、って話です。
SVRのハイパーパラメータ
たとえばSVRでは、C・ε・γの3つもハイパーパラメータの値を最適化しなければなりません。最適化には時間もかかります。それを、適当に3つの値を決めて、SVRモデルを構築したら、そりゃモデルの性能が悪いときもあります。これは、手法が悪いのではなく、ハイパーパラメータの値が悪いということです。正しいやり方は、ハイパーパラメータの値を最適化してから、その最適値でSVRモデルを作るのです。そうすることで、SVRモデルは他の手法で作ったモデルと少なくとも同等以上の予測性能を持つようになります。
人格が悪いのではない!習慣が悪いだけ!
人でも同じです。人格は悪くないんです。データサイエンスの分野のハイパーパラメータに当たる、習慣が悪いだけなんです。その人にあった良い習慣をすれば、ちゃんとその人の性能は向上します。その人はデキるようになります。人を見るときは、人格ではなくその人の習慣を見るようにしましょう。
まとめ
何か悪いことがあったときに、人の人格やデータサイエンスの解析手法のせいにするのはやめましょう。その人にあった良い習慣は何で、どうすればその習慣をしてくれるかどうか考えるようにしましょう。もちろんデータ解析・分析するときは、手法ごとにハイパーパラメータの値を最適化してからモデルを作りましょう。
ご案内。
- 実践的なデータ解析の手順
- データ解析の手順の各段階における手法
- 公開中のプログラム・コード一覧(実用的かつ実践的なデータ解析・機械学習・データマイニング)
- 主成分分析(PCA)の進化する入門書・実践書~数式なしの導入から実践的応用・結果の解釈まで~(随時更新)
- 20人の学生に対する研究テーマの決め方
オススメ記事セレクション。
- 大学教員の5つのメリット (とデメリット?)
- 現役データサイエンティストへの『人工知能って怖いの?』に対する回答
- 人工知能との未来における人の役割~現役のデータサイエンティストのメッセージ~
- 集中する時間を確保するために大学教授が行っている8つのこと
- 風邪を引かないために大学教授が毎日行っている7つの方法
twitterでも発信中。
フォローしていただけると嬉しいです。
Follow @univprofblog1Tweets by univprofblog1
無料メルマガでブログにない情報を配信中。
無料メルマガの登録はこちら