异常检测
BUPT-WT
不积硅步无以至千里,不积小流无以成江海
展开
-
异常检测-箱线图
箱线图表示一组数据分散情况的统计表示图,如下图所示:通常步骤:1. 计算上四分位数-Q3, 中位数,下四分位数-Q12. 计算上四分位数和下四分位数之间的差值,即四分位数差值-IQR(Q3-Q1)3. 大于上四分位数1.5倍四分位数差的值,或者小于下四分位数1.5倍四分位数差的值,即为温和异常值4. 大于上四分位数3倍四分位数差的值,或者小于下四分位数3倍四分位数差的值,即为极端异常值example:import mathdef anomaly_value(data_l原创 2021-08-07 14:58:31 · 525 阅读 · 0 评论 -
异常检测-孤立森林(IsolationForest)
一、原理 孤立森林是以递归方式划分数据集的各个树结构的集合。对于该过程的每一次迭代,都会选择一个随机特征,然后根据在所选特征的最小值和最大值之间随机选择一个值对数据划分。重复此过程,直到对整个数据集进行划分,在森林重形成一个单独的树。一般情况下,异常与根位置之间的路径比正常数据点短的多,因为他们更容易被隔离。注:可以使用一个涉及平均路径长度的数据点函数来找出异常分数 ...原创 2021-03-11 09:10:55 · 716 阅读 · 1 评论