sklearn中的异常检测方法

最新推荐文章于 2024-09-12 19:36:55 发布

hustqb

最新推荐文章于 2024-09-12 19:36:55 发布

阅读量3.6w

点赞数 22

分类专栏：机器学习文章标签： python 机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/hustqb/article/details/75216241

版权

本文介绍了sklearn库中的异常检测方法，包括Novelty Detection和Outlier Detection。重点讨论了One-Class SVM、Isolation Forest和Local Outlier Factor（LOF）等模型，并对比了它们的适用场景和工作原理。

摘要由CSDN通过智能技术生成

本文是对sklearn 2.7. Novelty and Outlier Detection的一个简单总结。

简介

假设我们有一个数据集，这个数据集中只有两类：正常(又称inliner）和异常（又称outliner）。

怎么就叫正常：

占数据集的大多数
在各个维度上比较聚集

怎么就叫异常：

占少数
通常是比较分散

很多场景下我们需要识别正常和异常，即异常检测，特别常见于数据清洗。

异常检测的分类

novelty detection: 训练集中没有异常样本

outlier detection: 训练集中有异常样本

乍一看，novelty detection相对更容易一些，其实不然

让我们再详细看一下novelty detection和outlier detection的区别。

它们的关注对象不同。novelty detection认为，所有跟训练集样本类别不同的点都是异常，不论它跟正常样本有多像，也不论它的分布有多聚集；而outlier detection要求更宽松，只有那些分布稀疏且

最低0.47元/天解锁文章

关注

22
点赞
踩
128

收藏

觉得还不错? 一键收藏
17
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 17

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。