首先
df_ARIMA= df2.loc[:, ['时间', '比差(%)']]
#把“时间”转化为datatime
df_ARIMA['时间'] = pd.to_datetime(df_ARIMA['时间'], format='%Y%m%d%H%M%S')
print(df_ARIMA)
# 去除重复标签
df_ARIMA = df_ARIMA.drop_duplicates(subset='时间', keep='first')
# 设置时间索引并调整频率
data = df_ARIMA.set_index('时间')
data.index = pd.to_datetime(data.index)
data = data.asfreq('s')
print(data)#完整的按秒采样的时间序列索引
#去除缺失值
data.replace([np.inf, -np.inf], np.nan, inplace=True)
data.dropna(inplace=True)
print(data)
代码如上所示
首先是原始的dataframe
把时间作为索引, 然后创造完整的以秒为频率的时间序列
去除缺失值