数据处理
Python数据处理
宝石男孩
这个作者很懒,什么都没留下…
展开
-
Pandas+Knn 数据预处理:填充缺失值
原始数据与待处理问题原始数据如图:pm10列存在很多缺失的数据,同时跟时间和站点有关系,所以不能用直接求均值或者众数或者直接删除的方法来填充pm10的缺失值。处理思路:预测填充缺失值因为涉及到跟时间有关,技术太菜,不会利用LSTM或者RNN等来预测缺失的数据值,于是就想到KNN算法的设计思想,将所有的指标都当做距离计算的一部分,这里的时间由于是2020-01-02 20:00:00的格式,使用了字符串切片和根据index替换的方式把日期格式改为:20010220(因为时间格式都是一样的年月日整点时间)原创 2020-11-02 15:52:12 · 8424 阅读 · 0 评论 -
pd.read_csv出错:OSError: Initializing from file failed
错误描述: self._reader = parsers.TextReader(src, **kwds) File "pandas/_libs/parsers.pyx", line 394, in pandas._libs.parsers.TextReader.__cinit__ (pandas\_libs\parsers.c:4209) File "pandas/_libs/parsers.pyx", line 712, in pandas._libs.parsers.TextReader._s原创 2020-10-18 10:25:38 · 432 阅读 · 0 评论