MAD 定义为,一元序列 X i X_i Xi 同其中位数偏差的绝对值的中位数(deviation,偏差本身有正有负);
MAD=median ( ∣ X i − median(X) ∣ ) \text{MAD=median}\left(|X_i-\text{median(X)}|\right) MAD=median(∣Xi−median(X)∣)
1. MAD 用于异常点的检测
假定数据服从正态分布,我们让异常点(outliers)落在两侧的 50% 的面积里,让正常值落在中间的 50% 的区域里:
P ( ∣ X − μ ∣ ≤ M A D ) = P ( ∣ X − μ ∣ σ ≤ M A D σ ) = P ( Z ≤ M A D σ ) = 1