Python数据治理,异常点检测,离群点异常点分析
数据清洗中,一般是先检测异常点,删除之后把全部缺失值一起插值。异常点检测方法有很多,其中效果较好的是均值标准差,四分位(箱图)和DBSCAN聚类。在Python中,都有现成的工具可以使用,下边把Python代码整理在一起方便使用。数据使用的大望村水厂的逐日供水数据(见下图),只需要把需要识别异常点的数据整理成第一列索引(label=time),第二列值(column=Value),就可以使用下列代码。均值标准差import pandas as pdimport numpy as npimport
原创
2021-04-18 11:37:45 ·
1310 阅读 ·
1 评论