pyod(Python Outlier Detection)是一个集成了30余种异常检测方法和模型的Python工具箱。从经典的 LOF (SIGMOD 2000) 到近两年的 COPOD (ICDM 2020) 和 SUOD (MLSys 2021) 。
一、pyod概述
特性
- 丰富的模型,从 scikit-learn 中的经典算法,到近期的深度学习算法,以及诸如 COPOD 的新兴算法。
- 兼容 Python2 和 Python3。
- pyod对所涵盖的各种异常检测算法提供了统一的API,便于学习和使用。
异常检测算法基本都是无监督学习,所以只需要X(输入数据),而不需要y(标签)。
PyOD的使用方法和Sklearn中聚类分析很像,它的检测器(detector)均有统一的API。
二、PyOD模型使用
所有的PyOD检测器clf均有统一的API以便使用,完整的API使用参考可以查阅(API CheatSheet - pyod 0.6.8 documentation):
- fit(X): 用数据X来“训练/拟合”检测器clf。即在初始化检测器clf后,用X来“训练”它。
- fit_predict_score(X, y): 用数据X来训练检测器clf,并预测X的预测值,并在真实标签y上进行评估。此处的y只是用于评估,而非训练
- decision_function(X): 在检测