离群点(outlier detection)和新颖点(novelty detection)检测与OneClassSVM应用实例(基于python)

最新推荐文章于 2024-06-09 22:31:14 发布

奔跑的Yancy

最新推荐文章于 2024-06-09 22:31:14 发布

阅读量1.4w

点赞数 11

分类专栏：机器学习&数据挖掘(Data Mining) 文章标签：离群点检测新颖性检测新颖点检测 oneclassSVM ocsvm

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/lyxleft/article/details/89344219

版权

目录

异常值检测（Outlier Detection）

新颖性检测（Novelty Detection）

sklearn.svm.OneClassSVM

引言

在异常检测领域中，我们常常需要决定新观察的点是否属于与现有观察点相同的分布（则它称为inlier），或者被认为是不同的（称为outlier）。在这里，必须做出两个重要的区别：

异常值检测，outlier detection：

训练数据包含异常值，这些异常值被定义为远离其他异常值的观察值。因此，异常检测估计器试图适应训练数据最集中的区域，忽略不正常的观察。

新颖点检测，novelty detection：

训练数据不受异常值的污染，我们有兴趣检测新观察是否是异常值。在这种情况下，异常值也被称为新颖点（a novelty）。

异常值检测和新颖性检测都属于异常检测，都是用来检测异常的、不常见的一些观察值。

异常值检测是一种无监督的方法，新颖点检测是一种半监督的异常检测方法。在异常值检测的情况下，异常值不能形成密集的簇，因为异常检测的估计器假设异常值总是位于低密度区域。相反，在新颖性检测的背景下，新颖点可以形成密集的簇，只要它们处于训练数据的低密度区域中。

scikit-learn框架提供了一套机器学习工具，可用于新颖性或异常值检测。这个策略是通过从数据中以无人监督的方式学习对象来实现的：

estimator.fit(X_train)

新的观测值，可以用如下方法来做个“预测”，即判断：

estimator.predict(X_test)

这里，正常的点（内部点，inliers）的标签是1，异常点是-1。预测方法利用估计器计算的原始评分函数的阈值。可以通过score_samples方法访问该评分函数，而阈值可以通过contamination参数来控制。

decision_function方法也可以从评分函数中定义，负值是异常值，非负值是内部点：

estimator.decision_function(X_test)

需要注意的是，

最低0.47元/天解锁文章

关注

11
点赞
踩
66

收藏

觉得还不错? 一键收藏
3
评论
离群点(outlier detection)和新颖点(novelty detection)检测与OneClassSVM应用实例(基于python)

目录引言异常值检测（Outlier Detection）新颖性检测（Novelty Detection）sklearn.svm.OneClassSVM引言在异常检测领域中，我们常常需要决定新观察的点是否属于与现有观察点相同的分布（则它称为inlier），或者被认为是不同的（称为outlier）。在这里，必须做出两个重要的区别：异常值检测，outlier detecti...
复制链接

扫一扫

专栏目录

奔跑的Yancy CSDN认证博客专家 CSDN认证企业博客

码龄7年

150: 原创

2万+: 周排名

169万+: 总排名

277万+: 访问

: 等级

1万+: 积分

1946: 粉丝

2070: 获赞

977: 评论

1万+: 收藏

私信

关注

热门文章

分类专栏

最新评论

Mac连上WIFI但是无法上网的3种解决方案
青霉素很安定: 感谢作者，我试了1234都不成功。然后突发奇想，会不会是浏览器插件OmegaSwitch的问题，还真的是。感觉是个乌龙，不过也给大家提个醒。
PIL：python图像处理类库的使用
普通网友: 这篇文章是优质之作，内容充实，结构明晰，语言流畅且通俗易懂，适合广大读者阅读。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
PIL：python图像处理类库的使用
普通网友: 每当我阅读你的编程博客文章时，我总能感受到你的专业水平和耐心解答的精神。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
PIL：python图像处理类库的使用
普通网友: 阅读这篇博文真是一次愉快的体验！作者的文字真是动人心弦，语言精准而生动。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
PIL：python图像处理类库的使用
普通网友: 干货满满！我也写了一篇获取【大厂面试真题解析、核心开发学习笔记、最新全套讲解视频、实战项目源码讲义、学习路线简历模板】的文章

最新文章

目录

评论 3

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。