HBOS——基于频数直方图的无监督异常点检测算法

异常点检测在数据挖掘中具有重要意义,HBOS(Histogram-based Outlier Score)是一种简单而有效的无监督算法。它通过对每个样本的特征进行异常评分来识别异常点,评分越高,异常可能性越大。算法通过构建频数直方图来估计连续数据的概率密度,高频区间的样本被赋予较低的异常评分。静态或动态设置的断点用于离散化连续数据,形成频数直方图,从而判断异常点。
摘要由CSDN通过智能技术生成

异常点检测是数据挖掘一个重要问题,当前的算法可以简单的分为监督、半监督和无监督的方法。对于存在标签的数据,监督算法是首选(能获得很好的效果),此时异常点检测可以等价于非平衡数据分类问题。但是,实际应用中往往只有正常样本的标签,这时需要无监督方法大显神威。无监督方法也更符合人类的认识行为。比如,一个人从来没有见过斑马,但是在一群马中他也可以很容易辨别出斑马,尽管完全不知道“斑马”是什么物种。

需要注意的是,很多有效的监督方法也是通过有机集成几种无监督方法构建。

HBOS(Histogram-based Outlier Score)是一种原理简单,且通常很有效的无监督算法。该方法为每一个样本进行异常评分,评分越高越可能是异常点。评分模型为:

                                                                              

假设样本pi 个特征的概率密度为 ,则p的概率密度可以计算为:

                                                                             

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值