機械学習

機械学習しようぜ! part5 家の価格を予測編 ②

こんちは!チズチズです。

https://www.kaggle.com/c/house-prices-advanced-regression-techniques

家の価格を予測する問題をまた解きます。

前のはスコア低すぎて… どうしようもありませんでした。

前の①でグラフ系全部載せるの忘れてました。

すみません、あとで載せておきます。

今日はリベンジ戦です!

単回帰のほうが良かった説

色んな人の解き方見ると単回帰の方がスコアが良いということなので、僕も単回帰にしてみます。

こんなもんですね。

スコアは0.28783で4319/4737 と300位程上がりました。

本当のこと言えばスコアめっちゃ良い人のコードコピペすれば結構順位上がります。そうしてる人も多いですが、僕は参考にして丸コピは避けてます。

それが俺のやり方だ!(プライドです…

多項式回帰でもやってみるか

案外多項式回帰の方がスコア良いかもしれないと思ったので、多項式回帰で実装してみます。

サンプルコードでやっただけなので、実装はとても大変でした…

結果は…

0.28960
微妙に前のほうが良かったです…

可視化するかぁ

グラフ化してみましょ

可視化させて何が悪いか見つけてみます。

重回帰分析

右下あたりはひどいですね…

左とかマイナスになってますw(家の価格がマイナスはあり得ない

単回帰分析

真ん中は結構良い線です。しかし、後半になるにつれて誤差が広がってますね。

外れ値の問題っぽい

多項式回帰

単回帰分析のグラフとほぼ変わりありません。

諦めるかまた挑戦か

取り敢えずスコアは0.1台に持っていきたいです。

精度を上げる方法を考えます。

  • 外れ値をちゃんと除去する
  • 分析方法を変える(大掛かり

このあたりしか思いつかない

ちょっと考えます。

外れ値除去をもうちょっとやってみたいです。

Kaggleやるとたくさんの発見ができます。

ぜひやってみてください!

COMMENT

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です