原文出处:拓端数据部落公众号
此示例显示了Hampel用于检测和删除异常值的过程的 实现。
产生一个包含24个样本的随机信号x。 重置随机数生成器以获得可重复的结果。
rng default
lx = 24;
x = randn(1,lx);
围绕x的每个元素生成观察窗口。 在样本的任一边取k = 2个邻居。 产生的移动窗口的长度为2×2 + 1 = 5个样本。
k = 2;
iLo = (1:lx)-k;
iHi = (1:lx)+k;
截断窗口,以便函数在到达信号边缘时计算较小段的中值。
iLo(iLo<1) = 1;
iHi(iHi>lx) = lx;
记录每个周围窗口的中位数。 找到每个元素相对于窗口中位数的绝对偏差的中位数。
for j = 1:lx
w = x(iLo(j):iHi(j));
medj = median(w);
mmed(j) = medj;
mmad(j) = median(abs(w-medj));
end
缩放中位数绝对偏差
1G2erf−1(1/2)≈1.4826
以获得正态分布标准偏差的估计值。
sd = mmad/(erfinv(1/2)*sqrt(2));
查找与中位数相差超过nd = 2个标准偏差的样本。 将这些离群值替换为其周围窗口的中间值。 这是Hampel算法的本质。
yu = x;
yu(ki) = mmed(ki);
使用hampel 计算滤波后的信号并注释异常值。 覆盖在此示例中计算的过滤值。
plot(yu,'o','HandleVisibility','off')
最受欢迎的见解
3.matlab偏最小二乘回归(PLSR)和主成分回归(PCR)