运行效果:分别用四种不同的方法对时序序列的异常点检测_哔哩哔哩_bilibili
1.时序数据(是对第四列(Dissolved Oxygen)溶解氧进行异常点检测)
2.四种异常点检测模型
2.1.iForest算法
对水质记录数据集中的溶解氧(Dissolved Oxygen)进行异常检测,并通过 Isolation Forest 算法识别出异常点。
具体流程如下:
-
导入所需的库和模块,包括 numpy、pandas、matplotlib、sklearn.metrics 中的 roc_auc_score,以及 sklearn.ensemble 中的 IsolationForest。
-
设置绘图相关的参数。
-
读取数据集并提取出溶解氧一列。
-
将溶解氧数据转换成二维数组,以便后续处理。
-
构建 IsolationForest 模型,并通过 fit 方法拟合数据。
-
通过 decision_function 方法获得每个数据点的异常程度,并将预测结果保存在 item 变量中。
-
使用 predict 方法预测每个数据点是否为异常点,并将预测结果保存在 pre 变量中。由于 Isolation Forest