![](https://img-blog.csdnimg.cn/20201014180756925.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
异常检测
文章平均质量分 93
妙龄少女郭德纲
个人公众号 是十三不是四十三 ,分享一些算法和大数据相关的知识~
展开
-
【异常检测】数据挖掘领域常用异常检测算法总结以及原理解析(二)
基于树的异常检测方法能够处理非线性关系,并且在处理大型数据集时相对高效。但它们对于高维数据的处理能力往往较弱,并且在异常点不是特别稀有时的检测效果会下降。孤立森林是一种高效的异常检测算法,它基于一个简单的假设:异常数据点通常是稀少的,且与正常数据点相比有着显著的不同。因此,相比于正常数据点,异常数据点更容易被“孤立”。孤立森林通过构建多棵“孤立树”来随机地“孤立”每个数据点。在每棵孤立树中,算法随机选择一个特征并随机选择该特征的一个切分值,以此将数据分成两部分。这个切分过程重复进行,直到每个点都被孤立或达到原创 2024-05-30 10:47:10 · 1471 阅读 · 0 评论 -
【异常检测】数据挖掘领域常用异常检测算法总结以及原理解析(一)
基于统计的异常检测方法主要依赖于统计学原理来识别数据中的异常值。这些方法通常假设数据遵循一定的统计分布,如正态分布等。基于正态分布,3sigma准则认为超过3sigma的数据为异常点。如果数据处于均值加减三倍标准差之间,则认为是正常数据,否则,则认为是异常数据。Z-Score(标准分数)异常检测方法是通过测量数据点与数据集均值的偏差程度来识别异常数据的。这种方法假设数据大致遵循正态分布(也称为高斯分布)。在正态分布中,大多数数据点(约68%)位于均值的一个标准差内,约95%的数据位于两个标准差内,而几乎原创 2024-05-30 10:21:50 · 2319 阅读 · 0 评论