异常检测
文章平均质量分 96
小四姑娘
这个作者很懒,什么都没留下…
展开
-
异常检测--高维数据异常检测
#异常检测——高维数据异常检测主要内容包括:Feature Bagging孤立森林文章目录1、引言2、Feature Bagging3、Isolation Forests4、总结5、练习6、参考文献1、引言在实际场景中,很多数据集都是多维度的。随着维度的增加,数据空间的大小(体积)会以指数级别增长,使数据变得稀疏,这便是维度诅咒的难题。维度诅咒不止给异常检测带来了挑战,对距离的计算,聚类都带来了难题。例如基于邻近度的方法是在所有维度使用距离函数来定义局部性,但是,在高维空间中,所有点对的原创 2021-01-24 18:05:15 · 629 阅读 · 0 评论 -
异常检测--基于相似度的方法
#异常检测——基于相似度的方法主要内容包括:基于距离的度量基于密度的度量文章目录1、概述2、基于距离的度量2.1 基于单元的方法2.2 基于索引的方法3、基于密度的度量3.1 k-距离(k-distance(p)):3.2 k-邻域(k-distance neighborhood):3.3 可达距离(reachability distance):3.4 局部可达密度(local reachability density):3.5 局部异常因子:4、练习参考资料:1、概述 “异常”通常是一个原创 2021-01-21 22:00:32 · 597 阅读 · 0 评论 -
异常检测--线性相关方法
#异常检测——线性相关方法@(Aaron) [异常检测, 线性方法]主要内容包括:线性回归主成分分析文章目录1、引言2、数据可视化3、线性回归3.1 基于自变量与因变量的线性回归3.1.1 最小二乘法3.1.2 梯度下降法3.2 基于异常检测的线性回归4、主成分分析4.1 原理推导4.2 归一化问题5、回归分析的局限性6、总结7、资料8、练习参考文献1、引言 真实数据集中不同维度的数据通常具有高度的相关性,这是因为不同的属性往往是由相同的基础过程以密切相关的方式产生的。在古典统计学中原创 2021-01-18 21:05:54 · 216 阅读 · 0 评论 -
异常检测---基于统计学的方法
异常检测——基于统计学的方法主要内容包括:高斯分布箱线图文章目录异常检测——基于统计学的方法1、概述2、参数方法3、非参数方法4、HBOS5、总结6、练习7、代码实战参考资料1、概述统计学方法对数据的正常性做出假定。**它们假定正常的数据对象由一个统计模型产生,而不遵守该模型的数据是异常点。**统计学方法的有效性高度依赖于对给定数据所做的统计模型假定是否成立。异常检测的统计学方法的一般思想是:学习一个拟合给定数据集的生成模型,然后识别该模型低概率区域中的对象,把它们作为异常点。即利用统计原创 2021-01-15 22:05:03 · 1433 阅读 · 0 评论