异常检测小结

1. 异常检测小结

异常检测本质上就是找不同,找到检测异常的点或者数据。李宏毅老师在异常检测这部分介绍了两种方法。分别用来处理带 label 的数据以及不带 label 的数据。

1.1 带 label 的数据

对于带 label 的数据(此处要求数据不含杂质,即数据不包含异常值点),我们可以训练一个分类器,得到每个数据的类别以及信心分数。比如对于火影忍者的人物,我们可以训练一个分类器,将其分为鸣人、佐助、雏田等等。这个时候,如果我们给分类器一个柯南的图片,分类器也会将其分为火影中的某一类人物,但是由于分类器从来没见过柯南,或者是柯南和火影里面的人物画风都不一样,这个时候分类器认为其属于各个人物的概率都是很低的,换句话说,分类器没把握把柯南分为任何一个火影人物。

接下来,我们可以根据信息分数将其分为异常点还是正常点,信心分数低的就会被分为异常点。
在这里插入图片描述

1.2 不带 label 的数据

不带 label 的数据,我们就可以去用一个概率密度函数去拟合数据的分布,将概率密度低的点划分为异常点。如下面这个图,我们可以使用一个二元的正态分布去拟合下面的数据,最终概率密度值比较低的数据点就会被归为异常点。
在这里插入图片描述
在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值