- 博客(1)
- 资源 (1)
- 收藏
- 关注
原创 Pandas+Knn 数据预处理:填充缺失值
原始数据与待处理问题原始数据如图:pm10列存在很多缺失的数据,同时跟时间和站点有关系,所以不能用直接求均值或者众数或者直接删除的方法来填充pm10的缺失值。处理思路:预测填充缺失值因为涉及到跟时间有关,技术太菜,不会利用LSTM或者RNN等来预测缺失的数据值,于是就想到KNN算法的设计思想,将所有的指标都当做距离计算的一部分,这里的时间由于是2020-01-02 20:00:00的格式,使用了字符串切片和根据index替换的方式把日期格式改为:20010220(因为时间格式都是一样的年月日整点时间)
2020-11-02 15:52:12 8397
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人