from statsmodels.tsa.stattools import adfuller
# # dateparse = lambda dates: pd.datetime.strptime(time, '%Y-%m-%d-%H-%M')
# # data = pd.read_csv('mean_mwd.csv', parse_dates='data', index_col='data',date_parser=dateparse)
# data=pd.read_csv('预测模型/mean_mwd.csv')
data=pd.read_csv('预测模型/mean_mwd.csv',index_col="time",parse_dates=True)
result = adfuller(data["mwd"].values)
print(result)
# ih_df_diff = np.diff(data["mwd"].values) #将数据进行一阶差分滞后
# result = adfuller(ih_df_diff)
# print(result)
(-5.663580824698626, 9.260322874569353e-07, 13, 478, {'1%': -3.4441047380903007, '5%': -2.867605550172837, '10%': -2.570000704119326}, 4250.051766745121)
第一个是adt检验的结果,简称为T值,表示t统计量。
第二个简称为p值,表示t统计量对应的概率值。
第三个表示延迟。
第四个表示测试的次数。
第五个是配合第一个一起看的,是在99%,95%,90%置信区间下的临界的ADF检验的值。
- 1%、%5、%10不同程度拒绝原假设的统计值和ADF Test result的比较,ADF Test result同时小于1%、5%、10%即说明非常好地拒绝该假设。
- 值要求小于给定的显著水平,p值要小于0.05,等于0是最好的
我们现在数据的adf值是-5,小于1%5%10%,说明数据可以