機械学習の鍵!汎化誤差を理解する
- 汎化誤差とは
機械学習の目的は、コンピュータに大量のデータからパターンを学習させ、将来の未知のデータに対して正確な予測をできるようにすることです。この未知のデータに対する予測能力を測る指標こそが「汎化誤差」です。
例えば、大量の猫と犬の画像を学習したモデルがあるとします。このモデルに、学習に使っていない全く新しい猫の画像を見せた時に、正しく「猫」だと予測できるかどうかが重要になります。この時、どれだけ正確に「猫」だと予測できるかを表すのが汎化誤差です。
逆に、学習に用いたデータに対して高い精度で予測できたとしても、それは単にデータの特徴を丸暗記しただけかもしれません。未知のデータに対して予測を外してしまうようでは、実用的なモデルとは言えません。
つまり、私達が目指すのは、汎化誤差の小さい、つまり未知のデータに対しても高い精度で予測できるモデルを構築することなのです。