异常检测
文章平均质量分 93
综述+理论+代码
无盐薯片
这个作者很懒,什么都没留下…
展开
-
异常检测-高维数据
提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档异常检测-高维数据前言一、Feature Baggingbootstrapbaggingfeature bagging二、Isolation Forests实现代码前言在实际场景中,很多数据集都是多维度的。随着维度的增加,数据空间的大小(体积)会以指数级别增长,使数据变得稀疏,这便是维度诅咒的难题。维度诅咒不止给异常检测带来了挑战,对距离的计算,聚类都带来了难题。例如基于邻近度的方法是在所有维度使用距离函数来定义局部性,但是,在高维空原创 2021-01-25 00:00:28 · 221 阅读 · 0 评论 -
异常监测——基于相似度的方法
提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档异常监测——基于相似度的方法一、基于距离单元的方法二、基于密度第k距离距离的计算方式欧式距离马氏距离k邻域可达距离局部可达密度局部异常因子一、基于距离基于距离的方法是一种常见的适用于各种数据域的异常检测算法,它基于最近邻距离来定义异常值。 此类方法不仅适用于多维数值数据,在其他许多领域,例如分类数据,文本数据,时间序列数据和序列数据等方面也有广泛的应用。 基于距离的异常检测有这样一个前提假设,即异常点的 k 近邻距离要远大于正常点原创 2021-01-21 23:56:35 · 193 阅读 · 0 评论 -
异常检测-线性模型
提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档异常检测-线性模型前言一、线性回归最小二乘估计二、 主成分分析前言真实数据集中不同维度的数据通常具有高度的相关性,这是因为不同的属性往往是由相同的基础过程以密切相关的方式产生的。在古典统计学中,这被称为——回归建模,一种参数化的相关性分析。一类相关性分析试图通过其他变量预测单独的属性值,另一类方法用一些潜在变量来代表整个数据。前者的代表是 线性回归,后者一个典型的例子是 主成分分析。本文将会用这两种典型的线性相关分析方法进行异常检测。原创 2021-01-18 22:29:28 · 197 阅读 · 0 评论