RAE:異なる尺度を扱う時の誤差評価
機械学習の世界では、あるデータを使って別のデータを予測する回帰モデルが幅広く活用されています。例えば、過去の商品の売れ行きデータから今後の売上を予測したり、家の広さや建築されてからの年数から価格を予測したりすることが可能となります。
このようなモデルの性能を評価するには、モデルが予測した値と実際の値がどれくらいずれているかを測ることが重要となります。このずれの大きさを測る指標として、平均二乗誤差(MSE)や決定係数(R²)などがよく用いられます。
平均二乗誤差は、予測値と実際の値の差を二乗したものを平均した値です。この値が小さいほど、モデルの予測精度が高いことを示しています。一方、決定係数は、予測値が実際の値をどれくらい説明できているかを表す指標です。0から1の値を取り、1に近いほどモデルの適合度が高いことを意味します。
これらの指標を用いることで、異なる回帰モデルを比較したり、モデルの改善度合いを測ったりすることができます。回帰モデルを構築する際には、これらの評価指標を理解し、適切に用いることが重要です。