Task_2:基于统计学的方法
问题1:非参数方法的直方图
怎么构造
如何检测
判断正常与异常的依据是啥?
基于角度的思想:
角度思想顾名思义,依据角度去判断异常与正常数据。角度又是什么角度,它是指数据间的角度,是三个或以上的数据点连线构成的角度。
如果其中有个点与另外两个点构成的角度非常小,小是相对于内部数据点的角度大且方向多,那么异常数据也就可以学习到。
对于如何数学推导,证明待补
HBOS
相对于角度算法,时间复杂度比较小,对于大型数据集比较友好。
限定:单变量,不依赖特征间的关系,基本假设为数据集各个维度独立
流程:按照数据分布构造直方图 + 归一化直方图
总结:又数据学习模型
:局部异常检测、局部异常值