SSE: 機械学習モデルの予測精度を測る
- SSEとは
SSEは「残差平方和」の略で、統計学や機械学習の分野で、モデルの予測精度を評価する際に頻繁に用いられる指標です。
モデルを作成する際には、得られたデータに基づいて、将来のデータや未知のデータを予測することを目指します。しかし、どんなに精度の高いモデルでも、実際の観測値と完全に一致する予測をすることは難しいです。そこで、モデルの予測値と実際の観測値との間にどれだけの差(ズレ)があるのかを測る必要があります。このズレのことを「残差」と呼びます。
SSEは、この残差をより正確に評価するために用いられます。具体的には、それぞれのデータ点における残差を二乗し、それらを全て足し合わせることで計算されます。残差を二乗することで、大きなズレを持つデータの影響をより強く反映することができます。
SSEは値が小さいほど、モデルの予測精度が高いことを示します。言い換えれば、SSEが小さいほど、モデルが実際のデータによく当てはまっていると言えます。逆に、SSEが大きい場合は、モデルの予測精度が低く、改善の余地があることを示唆しています。
SSEは単独で用いられることもありますが、他の指標と組み合わせて用いられることも少なくありません。例えば、RMSE(平方根平均二乗誤差)は、SSEの平方根を計算することで得られる指標で、より解釈しやすい形になっています。