异常检测1

基于统计学的方法

统计学方法对数据的正常性做出假定。它们假定正常的数据对象由一个统计模型产生,而不遵守该模型
的数据是异常点。统计学方法的有效性高度依赖于对给定数据所做的统计模型假定是否成立。
异常检测的统计学方法的一般思想是:学习一个拟合给定数据集的生成模型,然后识别该模型低概率区
域中的对象,把它们作为异常点。
即利用统计学方法建立一个模型,然后考虑对象有多大可能符合该模型。

z-score异常检测

假设样本服从正态分布,用于描述样本偏离正态分布的程度。

通过计算𝜇和𝜎得到当前样本所属于的正态分布的表达式,然后分别计算每个样本在这个概率密度函数下被生成的概率,当概率小于某一阈值我们认为这个样本是不属于这个分布的,因此定义为异常值。

计算公式:
在这里插入图片描述
一旦我们获得了平均值和方差的估计值,给定了新的一个训练实例,根据模型计算
在这里插入图片描述
当p(x)<ε p(x)<\varepsilonp(x)<ε时,数据为异常。 概率值小于人为设定的阈值认为是一个异常值

缺点:需要假设样本满足正态分布,而我们大部分场景都不满足这种假设条件。维度高计算复杂 没有几个特征满足独立同分布

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值