孤立森林异常分数公式剖析

孤立森林异常分数公式剖析
摘要由CSDN通过智能技术生成

近日在设计一个算法,突然想起来孤立森林的异常分数公式还是一知半解,便重新剖析了下孤立森林的异常公式:

编辑切换为居中

添加图片注释,不超过 140 字(可选)

问题1:c( ψ )哪来的?孤立森林原始论文中作者给出了该公式的来源:借鉴了bst算法的平均路径计算。

编辑切换为居中

添加图片注释,不超过 140 字(可选)

问题2:为什么底数是2,而不是10,100?:从原始论文揣摩,因为是作者为了将异常范围作为0.5进行分隔,如果某个点接近1,大概是异常,接近0大概率是正常的,如果所有点都在0.5范围波动大概率没有异常点。

问题3:为什么c( ψ )作为分母?:将E(h(x))进行归一化。

问题4:为什么要将E(h(x))进行归一化?这样可以找到类似于0.5的分隔点,可以作为衡量标准,不然没有衡量标准。

参考:https://cs.nju.edu.cn/zhouzh/zhouzh.files/publication/icdm08b.pdf?q=isolation-forest

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值