孤立森林Isolation Forest笔记

最新推荐文章于 2024-08-23 16:53:34 发布

付付要努力呀

最新推荐文章于 2024-08-23 16:53:34 发布

阅读量217

点赞数

分类专栏：机器学习文章标签： python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_45942265/article/details/118293199

版权

机器学习专栏收录该内容

12 篇文章 0 订阅

订阅专栏

笔记

Isolation Forest
与其他算法的区别
训练过程
- 建立一棵树的过程
- 整合全部孤立树的结果
例子

Isolation Forest

链接
异常点定义为那些 “容易被孤立的离群点” —— 可以理解为分布稀疏，且距离高密度群体较远的点。
在这里插入图片描述
常见的场景包括：网络安全中的攻击检测、金融交易欺诈检测、疾病侦测、**噪声数据过滤（数据清洗）**等。

与其他算法的区别

大多数基于模型的异常检测算法会先 ”规定“ 正常点的范围或模式，如果某个点不符合这个模式，或者说不在正常范围内，那么模型会将其判定为异常点。
在这里插入图片描述

训练过程

孤立森林是类似与集成算法，建立很多棵树，然后最后平均所有树的结果，成为我们最终的结果。

建立一棵树的过程

1.在训练数据中随机选择特征，作为一颗孤立树的根节点。
2.随机指定一个维度。在当前的特征内，随机产生一个切割点p
3.此时将当前数据空间切分为2个子空间，一个是所选维度大于p的点，一个是小于p的点。
4.在两个子空间内在递归2 3 步，不断构造新的叶子节点，直到叶子节点上只有一个数据（无法再继续切割）或者达到了我们我设置的树的高度。
在这里插入图片描述

整合全部孤立树的结果

由于切割过程是随机的，我们是随机的选取特征进行分割，所以需要集成的方法也就是集合所有树的结果来使结果收敛，即反复的从头开始切，然后计算每次切分结果的平均值。

例子

在这里插入图片描述

武林外传有很多很多人物，即全部样本为x，我们选取子样本即其中9个人物建立其中一颗孤立树。把这9个人作为一个子样本放入一颗孤立树的根节点，
在这里插入图片描述
然后随机选择特征，随机选择一个切割点p，大于18和小于18.。。

但看一棵树，莫小贝的异常程度最高。但是，他之所以最先被孤立出来，与随机选择到的特征顺序有关，所以我们通过对多棵树进行训练，来去除这种随机性，让结果尽量收敛。

https://www.pianshen.com/article/3092770169/

付付要努力呀

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
孤立森林Isolation Forest笔记

笔记Isolation Forest与其他算法的区别训练过程建立一棵树的过程整合全部孤立树的结果例子Isolation Forest异常点定义为那些 “容易被孤立的离群点” —— 可以理解为分布稀疏，且距离高密度群体较远的点。常见的场景包括：网络安全中的攻击检测、金融交易欺诈检测、疾病侦测、**噪声数据过滤（数据清洗）**等。与其他算法的区别大多数基于模型的异常检测算法会先 ”规定“ 正常点的范围或模式，如果某个点不符合这个模式，或者说不在正常范围内，那么模型会将其判定为异常点。训练过程孤
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。