sklearn实现 孤立森林_异常检测 | 使用孤立森林 sklearn.ensemble.IsolationForest 分析异常流量...

孤立森林

Isolation Forest(sklearn.ensemble.IsolationForest):一种适用于 连续数据的 无监督异常检测方法。与随机森林类似,都是高效的集成算法,相较于LOF,K-means等传统算法,该算法鲁棒性高且对数据集的分布无假设。

Isolation Forest算法做非监督式的异常点检测分析,对数据特征的要求宽松:

该算法对特征的要求低,不需要做离散化,不需要数值标准化

不需要考虑特征间的关系(例如共线性)等,不需要额外做特征过滤和筛选

附:SKlearn 中其他用于异常检测的方法

one-class SVM(svm.OneClassSVM)

LocalOutlierFactor(sklearn.neighbors.LocalOutlierFactor)

EllipticEnvelope(covariance.EllipticEnvelope)

本案例中

需求:分析一下通过不同渠道来到网站的访客里面是否有异常流量

数据特点:(综合数据特点,选择Isolation Forest算法做非监督式的异常点检测分析)

数据是不带标记的数据,只能用无监督式分析方法

特征维度较高,有的特征是分类型变量,有的特征是数值型变量

代码示例

1 数据预处理

1.1 填充缺失值、去除无关项(如 用户id,可能影响结果)

【此处,处理好的数据集是df 】

不是主要代码,略

1.2

  • 1
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值