アルゴリズム データのばらつきを見る: MAD入門
- MADとはMADは「平均絶対偏差」を意味する言葉で、データのばらつき具合、つまりデータがどれだけ散らばっているかを表す指標です。平均偏差や絶対偏差と呼ばれることもあります。例えば、ある商品の販売数を毎日記録していたとします。その販売数の平均値が10個だったとしても、毎日ぴったり10個売れるとは限りません。日によっては5個しか売れない日もあれば、15個売れる日もあるでしょう。このように、実際のデータは平均値の周りにばらついて存在するのが一般的です。このデータのばらつき具合を把握することは、データの特性を理解する上でとても重要になります。MADは、それぞれのデータが平均値からどれくらい離れているかを計算し、その平均値を求めることで、データ全体のばらつき具合を一つの数値で表しています。 MADの値が大きいほどデータのばらつきが大きく、小さいほどばらつきが小さいことを示します。MADは計算が比較的容易であるため、データ分析の現場で広く活用されています。特に、異常値の影響を受けにくいという特徴から、外れ値を含むデータセットの分析にも適しています。
