機械学習の評価指標:中央絶対誤差とは
- 予測誤差を測る機械学習モデルの性能を評価する上で、予測値と実際の値のずれ、つまり「誤差」を測ることは非常に重要です。この誤差が小さいほど、モデルの予測精度が高いと判断できます。しかし、誤差を測る指標は一つではなく、状況に応じて適切な指標を用いる必要があります。今回は、数ある指標の中でも、「中央絶対誤差(Median Absolute Error MAE)」という指標について詳しく解説していきます。MAEは、予測値と実際の値の差(誤差)の絶対値の中央値を計算することで得られます。具体的には、まずそれぞれのデータについて予測値と実際の値の差を計算し、その絶対値を求めます。次に、得られた絶対値を小さい順に並べ、中央に位置する値を求めます。これがMAEです。MAEは、外れ値の影響を受けにくいという特徴があります。外れ値とは、他のデータから大きく離れた値のことです。例えば、ほとんどのデータが100前後に集中しているのに対し、一つだけ1000という値がある場合、この1000という値が外れ値です。MAEは中央値を用いるため、このような外れ値の影響を受けにくく、データ全体を代表するような誤差を把握することができます。一方、MAEは絶対値を用いるため、誤差がプラスかマイナスかを区別することができません。そのため、予測値が実際の値よりも大きいか小さいかを知りたい場合には、MAEではなく、他の指標を用いる必要があります。まとめると、MAEは外れ値の影響を受けにくい誤差指標であり、データ全体を代表するような誤差を把握するのに役立ちます。しかし、誤差の方向性を考慮しないため、必要に応じて他の指標と組み合わせて使用することが重要です。