异常检测之线性方法

mario12315

于 2021-01-18 21:43:20 发布

阅读量793

点赞数

分类专栏： python 异常检测文章标签：数据挖掘

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/mario12315/article/details/112793091

版权

感谢datawhale大部队！

一引言

在异常检测中，线性方法也是常用的实现方法之一。

现实业务场景数据中，不同维度的数据通常具有显著相关性，这是因为不同的属性往往是由相同的基础过程以密切相关的方式产生的。在古典统计学中，参数化的相关性分析被称为回归建模。

一类相关性分析试图通过其他变量预测单独的属性值，另一类方法用一些潜在变量来代表整个数据。前者的代表是 线性回归，后者一个典型的例子是 主成分分析（PCA）。PCA（principal components analysis）即主成分分析技术，又称主分量分析，旨在利用降维的思想，把多指标转化为少数几个综合指标。在大多数情况下，主成分分析提供了去除异常值和进行异常检测最有效的方法，因为它对存在少数异常值的数据更有鲁棒性。

适用前提：

假设一：近似线性相关假设。线性相关假设是使用两种模型进行异常检测的重要理论基础。

假设二：子空间假设。子空间假设认为数据是镶嵌在低维子空间中的，线性方法的目的是找到合适的低维子空间使得异常点(o)在其中区别于正常点(n)。

二如何判断问题是否适用于用线性方法解决？

关键点：线性方法更适用于有近似性相关/子空间假设前提的数据集，因此，在具体建模前，有必要进行探索变量之间的相关性，以此判断该问题是否合适用线性方法解决。

可视化探索：

最低0.47元/天解锁文章

博客等级

码龄7年

10
原创

3
点赞

26
收藏

1
粉丝

关注

私信

热门文章

分类专栏

python 2篇
异常检测 4篇
SQL

最新评论

python-jupyter输出显示不全问题解决
MissPYL: UserWarning: Failed to import cef_gui, cef functions will be unavailable from .script_api import * 我的是在jupyter里面可视化的时候，画出的图只显示了1/4，而且那个图片的保存save按钮也不起作用
python-jupyter输出显示不全问题解决
mario12315: InteractiveShell.ast_node_interactivity = "all" 解决的是：不用print()也可以输出多个变量你遇到的具体是哪种显示问题？
python-jupyter输出显示不全问题解决
MissPYL: 没有变化呀，还是输出不太全

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。