Isolation Forest | 隔离森林论文阅读

最新推荐文章于 2024-08-03 13:57:10 发布

Chiang丶丨

最新推荐文章于 2024-08-03 13:57:10 发布

阅读量976

点赞数

分类专栏：机器学习论文阅读文章标签：机器学习人工智能算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u010486697/article/details/108669095

版权

Note of Isolation Forest

论文：https://cs.nju.edu.cn/zhouzh/zhouzh.files/publication/icdm08b.pdf

一、介绍

作者认为，异常数据存在两个显著的特性：

数量少，甚至是极少
与正常数据有显著的属性值差异

简单来说，异常是少且非常不同的。

因此，作者要做的就是找出这些异常点，而不是为正常数据建模（传统方法）。作者提出用树的结构去做这件事，并且在论文中会证明异常点更接近根节点（深度浅），正常点离根节点更远（深度深）。

作者称其构造的树为iTree或者Isolation Tree，称构造的树的集合为iForest或Isolation Forest。并且声称iForest只有两个参数：树的数量、子采样(sub-sampling)的大小；且只需要非常小的树的数量和非常小的子采样的大小就可以达到很好地检测效果和收敛效果。

二、Isolation and Isolation Trees

所谓Isolation，就是将一个实例同其他实例分隔开来。因为异常实例是非常少且非常不同的，因此异常实例是对这种分隔很敏感的。

有明显不同的属性值的实例就很容易分隔出来，而且往往比较早就被分隔出来，这也就意味着这些异常实例有比较短的“路径”，也即在树上有较浅的深度。

所谓Isolation Tree，是一棵完全二叉树，每一个节点要么没有孩子要么一定有两个孩子。构

最低0.47元/天解锁文章

关注

0
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
Isolation Forest | 隔离森林论文阅读

Note of Isolation Forest论文：https://cs.nju.edu.cn/zhouzh/zhouzh.files/publication/icdm08b.pdf一、介绍作者认为，异常数据存在两个显著的特性：数量少，甚至是极少与正常数据有显著的属性值差异简单来说，异常是少且非常不同的。因此，作者要做的就是找出这些异常点，而不是为正常数据建模（传统方法）。作者提出用树的结构去做这件事，并且在论文中会证明异常点更接近根节点（深度浅），正常点离根节点更远（深度深）。
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。