Z-score异常值检测法

Z-score异常值检测法是一种基于统计学原理的异常值检测技术。它通过计算数据点与数据集平均值的标准化距离来判断该数据点是否为异常值。

一、原理

Z-score异常值检测法的原理是基于标准正态分布。它通过计算每个数据点与数据集平均值的差距,并将其转换为标准差的倍数,以此来评估数据点的异常程度。在标准正态分布中,大约68%的数据点位于平均值的一个标准差之内,95%的数据点位于两个标准差之内,而99.7%的数据点位于三个标准差之内。因此,如果一个数据点的Z-score绝对值很大,即它距离平均值很多个标准差,那么它很可能是一个异常值。

Z-score的计算公式如下:

其中:

  • 𝑍是数据点 𝑋X 的Z-score。
  • 𝑋 是数据集中的某个数据点。
  • 𝜇 是数据集的平均值(均值)。
  • 𝜎 是数据集的标准差。

通常情况下,有两种常见的阈值选择:

  1. 阈值 = 2:如果使用Z-score的绝对值大于2作为异常值的判定标准,那么大约有95%的数据将位于这个阈值内,这意味着只有大约5%的数据可能被视为异常值。这是一个相对宽松的阈值,适用于不想过多排除数据点的情况。

  2. 阈值 = 3:如果使用Z-score的绝对值大于3作为异常值的判定标准,那么

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

吴闹闹(●'◡'●)

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值