Python时间序列--数据平稳(四)

1.平稳性
来自于扯扯金融
平稳性是用来描述时间序列数据统计性态的特有术语。
2.时间序列平稳性的理解
凭以推测经济系统(或其相关变量)在未来可能出现的状况,亦即预测经济系统(或其相关变量)的走势,是我们建立经济计量模型的主要目的。而基于随机变量的历史和现状来推测其未来,则是我们实施经济计量和预测的基本思路。这就需要假设随机变量的历史和现状具有代表性或可延续性。换句话说,随机变量的基本特性必须能在包括未来阶段的一个长时期里维持不变。否则,基于历史和现状来预测未来的思路便是错误的。

样本时间序列展现了随机变量的历史和现状,因此所谓随机变量基本性态的维持不变也就是要求样本数据时间序列的本质特征仍能延续到未来。我们用样本时间序列的均值、方差、协(自)方差来刻画该样本时间序列的本质特征。于是,我们称这些统计量的取值在未来仍能保持不变的样本时间序列具有平稳性。可见,一个平稳的时间序列指的是:遥想未来所能获得的样本时间序列,我们能断定其均值、方差、协方差必定与眼下已获得的样本时间序列等同。

相反,如果样本时间序列的本质特征只存在于所发生的当期,并不会延续到未来,亦即样本时间序列的均值、方差、协方差非常数,则这样一个过于独特的时间序列不足以昭示未来,我们便称这样的样本时间序列是非平稳的。

形象地理解,平稳性就是要求经由样本时间序列所得到的拟合曲线在未来的一段期间内仍能顺着现有的形态“惯性”地延续下去;如果数据非平稳,则说明样本拟合曲线的形态不具有“惯性”延续的特点,也就是基于未来将要获得的样本时间序列所拟合出来的曲线将迥异于当前的样本拟合曲线。

可见,时间序列平稳是经典回归分析赖以实施的基本假设;只有基于平稳时间序列的预测才是有效的。如果数据非平稳,则作为大样本下统计推断基础的“一致性”要求便被破坏,基于非平稳时间序列的预测也就失效。

3.平稳性分类
严平稳:严平稳表示的分布不随时间的改变而改变。也就是数据不论怎么取,期望都是0,方差都是1.

弱平稳:期望和相关系数(依赖性)不变。

4.示例–美国消费者信心指数

import pandas as pd
import numpy as np
import matplotlib.pylab as plt
import seaborn as sns
Sentiment = pd.read_csv('data/sentiment.csv', index_col=0, parse_dates=[0])
Sentiment.head()

在这里插入图片描述

# 选择2005 - 2016的数据并画出其对应的折线图
sentiment_short = Sentiment.loc['2005':'2016']
sentiment_short.plot()
plt.legend(bbox_to_anchor=(1.25, 0.5))#改变线性-UMCSENT的位置
plt.title("Consumer Sentiment")
sns.despine() #去掉图框

在这里插入图片描述
数据平稳–差分法

#绘出原始数据、一阶以及二阶差分数据后的折线图
sentiment_short['diff_1'] = sentiment_short['UMCSENT'].diff(1) #一个时间差值的一阶差分
sentiment_short['diff_2'] = sentiment_short['diff_1'].diff(1)#一个时间差值的二阶差分
sentiment_short.plot(subplots=True, figsize=(18, 12))

在这里插入图片描述可以看出二阶差分后,数据更加平稳。

  • 4
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值