开门见山的说
时间序列每天对应一个数值点,但是有时候会有缺失值,比如:
2020-04-10 y=100
2020-04-12 y=120
这里4月11号的信息是缺失的,目标是对这个缺失值进行线性填值,得到:
2020-04-11 y=110
有时候,也有可能连续缺失几天信息,比如:
2020-04-10 y=100
2020-04-13 y=115
这样就需要填充两天,得到:
2020-04-11 y=105
2020-04-12 y=110
python解决方案
import pad=ndas as pd
d = pd.DataFrame()
d['date'] = ['2019-01-01', '2019-01-02', '2019-01-04', '2019-01-07',
'2019-01-09',
'2019-01-11']
d['val'] = [10, 20, 30, 40, 50, 30]
d['date'] = pd.to_datetime(d['date'])
上面的代码可以生成一个dataframe,如下: