异常检测
lukeyyanghang
这个作者很懒,什么都没留下…
展开
-
异常检测
"An outlier is an observation which deviates so much from other observations as to arouse suspicions that it was generated by a different mechanism." — D. M. Hawkins,Identification of Outliers, Chapma...转载 2019-01-26 12:06:13 · 380 阅读 · 0 评论 -
Isolation Forest
什么是Isolation Forest? Isolation Forest的思路很简单。假设我们的数据集合是一维空间下的点 我们通过切分的方式可以很方便的将异常点B点切分出来。 如何定义方便? 切分的次数 那这个思路对于正常点点A来说也可以取,可以看到如果要把A隔离出来我要切很多遍。 Isolation Forest算法 1.训练:抽取多个样本,构建多棵二叉树(isolat...原创 2019-01-26 12:14:51 · 294 阅读 · 0 评论 -
Local Outlier Factor
什么是Local Outlier Factor? LOF(Local Outlier Factor),又称局部异常因子算法。 区别于Isolation Forest算法(切分次数),LOF算法以距离为切入点,做异常检测。 以上图为例,可以很简单的理解距离做异常检测来源的想法。 LOF的几个概念 1.d(p,o) 两点p和o之间的距离; 2.k-distance第k距离 d...原创 2019-01-31 15:48:03 · 1214 阅读 · 0 评论