树模型-孤立森林

孤立森林(Isolation Forest)是一种基于树模型的快速异常检测方法,利用异常点容易被孤立的特性进行检测。它通过随机特征和随机阈值划分构建多个树,异常点会在较浅的叶子节点被划分出来。算法包括随机采样子集、随机选择特征和阈值进行二分裂,以及根据树的平均深度计算异常概率。孤立森林适用于连续值属性,但对高维数据处理可能受到噪声影响。
摘要由CSDN通过智能技术生成

树模型

1、决策树 ID3,C4.5,CART
2、随机森林RF
3、Adaboost
4、GBDT
5、XGboost
6、孤立森林(异常检测)

六、孤立森林

​ 孤立森林(Isolation Foreset)是基于树(iTree)集成的快速异常检测方法,其异常检测的核心思想是“异常点是容易被孤立的离群点”。因此,孤立森林采用随机特征随机阈值划分生成多个树,直到树到达一定的高度或者直到每个叶子节点中只有一个点。那么,那些离群点很容易被提前(即所在叶子节点的深度较浅)被划分出来。由于每个树都是由随机采样独立生成的,所以树之间具有一定的独立性,多个树的集成就是最终的孤立森林。

这里写图片描述

可以看出,按照离群点大概率为异常点的话,那么d最有可能为异常点。

下面简单介绍孤立森林的流程和细节:

​ 1)从训练集中随机选择(有放回和无放回) n n 个样本点构成子集 Ω i , i 1 , 2.. m ,在 m m 个子集上构建树

​ 2)随机选择一个特征,随机选择一个阈值(最大值与最小值之间)进行二分裂

​ 3)递归2)建树,直到树到达一定的高度 d 或者每个叶子节点中只有一个点。

​ 4) m m 个树建好,根据 m

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值