异常检测——基于相似度的方法:基于距离的度量和基于密度的度量。
距离,无非就是公式的问题;而密度,就是一个阈值加公式的问题。
其实我个人并不喜欢基于相似度的方法,觉得这些方法似乎太过于主观了,并没有一个较好的泛化能力,就拿LOF来说,如果离群点比较集中在一处的话,那效果就不好。
这次比较难,学得糊里糊涂,似懂非懂,也只能说知道怎么用,我不喜欢这类方法,是因为我参加几场比赛分类极度不平衡的比赛,都曾用过这类方法,效果都不好,个人其实更喜欢深度学习中的focal损失函数,在处理分类不平衡问题有着较好的效果。