★★异常检测
异常检测相关算法整理
维格堂406小队
人天生都是软弱的,唯其软弱而犹能承担起苦难,才显出人的尊严。
展开
-
IsolationForest-03Sklearn源码
Intro 分析sklearn的IsolationForest源码,搞清楚代码结构和样本异常得分的计算逻辑。目前对python类、方法等概念不是很了解,只从直观上解释代码。查看源码的方式 建议直接用Pycharm,方便代码跳转查看。可以copy一个副本在相同目录下,如_iforestTest.py,后面可以直接在这个脚本里做注释。另外可以在该脚本中加入print语句,观察过程性数据。基...原创 2020-01-15 14:07:54 · 751 阅读 · 0 评论 -
IsolationForest-02Python案例
Intro sklearn中IsolationForest使用,包括参数说明和实际案例。 简述下算法思想: 随机选择特征,在该特征的maximum和minimum中随机选择切分值(split value)。如此递归划分,形成树。根节点到终止节点(叶子结点)的长度,等价于split的次数。对于多棵树,计算平均长度,可以反映样本异常的程度。即异常样本通常较快被划分到叶子结点,因而路径长度较小。...原创 2020-01-15 14:14:33 · 2690 阅读 · 2 评论 -
IsolationForest-01原理
Intro 2008年刘飞、周志华等提出Isolation Forest算法,iforest不借助类似距离、密度等指标去描述样本与其他样本的差异,而是直接去刻画所谓的疏离程度(isolation)。该算法简单、高效,在工业界应用较多(好像没有看到很多case)~ Isolation Forest算法的逻辑很直观,算法采用二叉树对数据进行split,样本选取、特征选取、split value...原创 2020-01-15 14:03:13 · 445 阅读 · 0 评论