数据预处理
小羊来66
只会Command C+V
展开
-
时间序列使用KNNImputer插值,估计值一样
问题描述时间序列问题中经常遇到数据缺失的情况,线性插值、均值插值效果一般,因此考虑使用KNN插值,但是使用过程中发现每一列缺失的地方补齐的数都是一样的,应该就是将一列的平均数填充进去了。查阅资料后发现应该是插值时的neighbor不是指时间顺序(索引顺序)。修改前:from numpy import isnanfrom pandas import read_csvfrom sklearn.impute import KNNImputer# split into input and outp原创 2021-10-20 11:51:10 · 1355 阅读 · 1 评论 -
DataFrame插入一列数据
在最左侧插入一列数据将dataframe的时间列插入到imputation的第一列中# 第一个参数指插入的位置,0表示第一列# 第二个参数指这一列的名字# 第三个参数为插入的数据imputation.insert(0, '时间', dataframe["时间"])参考链接https://blog.csdn.net/qq_35318838/article/details/102720553...原创 2021-10-20 10:24:24 · 2748 阅读 · 0 评论