时间 | 指标1 | 指标2 |
---|---|---|
time1 | data | data |
time2 | data | data |
time3 | data | data |
… | … | … |
假设你有一个数据,行是时间序列,列是一个个指标,假设,但是其中包括一些缺失值,这些缺失值有的是两个,有的是一个,有的是一片,而且不止一列有,如下图
那你找对地方了,R语言只需要一个函数就可以补了一个数据框中所有列的缺失值,首先你需要下载zoo
包。
如果是线性插值,这个函数叫na.approx
,但是该函数导出的是一个矩阵,所以还需要转一次数据框
df_interped <- as.data.frame(na.approx(df))
让我们看看结果是不是对列进行了线性插值,对比刚刚缺失的92、93行,和97行,完全没有问题!而且多列也适用(这里没展示)!只能说这个函数太强了!
zoo
还提供了样条插值na.spline
,有兴趣可以去了解更多。
🫥🫥🫥🫥🫥🫥🫥🫥🫥🫥🫥🫥🫥🫥🫥🫥🫥🫥🫥🫥🫥🫥🫥🫥🫥🫥🫥🫥🫥🫥🫥