プログラミング

機械学習しようぜ! Part2何するの?編

こんにちは! チズチズです。

機械学習でできることはわかった。 じゃあどうすればいい。

初心者の半数以上はここでつまづきます。

機械学習でできることを理解

→機械学習のコードを見る

→意味不で挫折

僕も初めの頃はここでつまづきました。

いくらPythonの基礎知識があったとしても機械学習になると話が変わります。

コードがガラッと変わります!

機械学習の実装の流れ

  1. 何するか決める
  2. データを入手
  3. データの特性を知る
  4. データの前処理
  5. モデルを作って精度を確認
  6. データとモデルの調整
  7. ⑤と⑥の繰り返し
  8. 完成!

ざっとはこんな感じです。

①何するか決める

画像認識だったら猫と犬を見分ける

顔から年齢を予測する(テレビでやってる

野球の試合の来場者数の予測

等々…

気になったものからやってみるのがいいです。

あんま考え込みすぎないほうが良いです。

面白いのでも…

②データの入手

https://www.e-stat.go.jp/ 日本の統計がまとめられています。

人口等の予測にはうってつけですね!

データって入手が難しいんですよ…

https://signate.jp/コンテストとして開催されているSIGNATEの練習問題やコンテストはデータをダウンロードできるので、コンテストで周りと精度を比べられて自分のスキルアップにも繋げられていいですよ。

https://www.kaggle.com/ 同じくコンテストですが、これはアメリカが開催しているkaggleです。データ分析のコンテストは前者よりも有名ですよ~

日本の人も多数参加しているので知ってる人に聞いてみるのも良いですね。

③データの特性を知る

データを入手はできた!

早速モデルを作ろう!

まず、データを見てみよう

絶対ではないですが、まずデータを見ましょう。

グラフ化してみたり、数値化してみたり…

どんな条件のときにこんな結果が出るのか少し見てみるのが良いです。

何で?

後で精度を上げようとしたときにどうすればいいかわからなくなるから!

はい。

一度目を通してみましょう。 後悔したくないです。

④データの前処理

前処理には機械学習の実装の8割程時間がかかります

本当に時間がかかります。

だけど、とっても大事です。

例えば「月」「火」…「日」というカテゴリがあったとします。

これをそのまま実装したらエラーが出ます。

コンピュータは数字じゃないと認識してくれません!!!

数字にしてくれる自動化のツールはあるのでそこまで苦労はしませんが、忘れないでくださいね!

他にも画像認識だったら解像度の変更があります。

前処理をすることで、モデルの再構築が楽になります。

前処理で手を抜くと、後が大変です

前処理大変だけど、初めにやっとけば後は楽~~

⑤モデルを作って精度を確認、⑥データとモデルの調整

さっきからモデルモデル言ってましたが、

女優のモデルじゃないですよ。

数学の関数みたいに入力から出力の中の部分です。

例 1を入力したら5が出てくる

一旦モデルを作っちゃいましょ!

初めは精度が低いです。

そこからモデルを微調整させて、完成度の高いモデルに仕上げるのです!!!

良い調整の方法は何を予測するかによって結構変わりますが例えば使うデータを取捨選択させたり、画像の水増しをしたりと割と多いです。

⑦ ⑤と⑥の繰り返し

できそうだなって思ったことは実装してみてもう無理だと思ったら諦めましょう。

一番精度の高かったモデルが完成品です。

 

COMMENT

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です