「Python量化基础」时间序列的自相关性与平稳性

01 引言

金融数据主要分为时间序列(时间维度)、横截面(个体维度)和面板数据(时间+截面)。比如上证综指2019年1月至今的日收盘价数据就是时间序列,而2019年8月12日所有A股收盘价数据则是横截面数据,2018-2019年3000多只个股收盘价数据便是面板数据。金融时间序列分析是量化投资建模的重要基础,今天给大家分享时间序列的一些基础概念,包括自相关性、偏自相关性、白噪声和平稳性,以及Python的简单实现,为后续关于时间序列建模专题做一个铺垫。Python中的statsmodels包提供了强大的统计和计量建模函数,其中子模块tsa(time series analysis)专门用于时间序列分析。

02 自相关性

相关性一般是指两个变量之间的统计关联性,那么自相关性则是指一个时间序列的两个不同时间点的变量是否相关联。时间序列具有自相关性是我们能够进行分析的前提,若时间序列的自相关性为0,也就是说各个时点的变量不相互关联,那么未来与现在和过去就没有联系,根据过去信息来推测未来就变得毫无根据。时间序列的自相关性一般用时间序列的自协方差函数、自相关系数函数和偏自相关系数函数等统计量来衡量。遇到问题没人解答,小编创建了一个Python学习交流裙:五二八 三九七 六一七, 寻找有志同道合的小伙伴,互帮互助,群里还有不错的学习视频教程和PDF电子书分享!

自协方差函数

自协方差(Autocovariance,简称AF)是时间序列与其滞后项的协方差,假设X为随机变量(即随着时间变化取值随机的变量,比如股票价格),则k阶自协方差使用数学公式表示为:

其中,E表示求数学期望,u是随机变量X的均值,当k=0时,可得

即为随机变量X的方差。

自相关函数

自协方差跟变量的单位有很大关系,比如X放大10倍,则自协方差将放大100倍,因此其值大小并不能反映相关性的大小。为了消除量纲(单位)的影响,使用自相关系数来刻画变量与其滞后项的相关性。自相关系数(Autocorrelation Coefficient,简称ACF)本质是相关系数,等于自协方差除以方差,k阶自相关系数数可以表示为:

上过高中数学的都知道协方差和相关系数的含义,从统计上描述两个不同变量的相互影响关系(非因果),那么自协方差和自相关系数则是刻画同一个变量在不同时期取值的相关程度,比如描述上证综指过去价格对今天价格的影响。

偏自相关函数

假设对于上证综指价格序列,一阶自相关系数大于0,说明今天的价格与昨天的价格相关,而昨天价格又与前一日价格相关,依次类推,可见当你计算今天与昨天价格之间的自相关系数时,同时包含了更早之前所有各期的信息对今天的间接影响,度量的是过去所有信息加总的影响效果。为了剔除其他各期的影响,单纯考察过去某一单期对今天的影响,引入偏自相关函数(Partial Autocorrelation Coefficient,简称PACF),即条件自相关系数,使用数学公式表示为:

偏自相关函数可以通过自回归模型(后续关于时间序列建模会进一步分析)来表述和求解,用

表示k阶自回归式中第j个回归系数,则k阶自回归模型表示为

 

其中

是最后一个系数。若把

看作滞后期k的函数,则称

  • 5
    点赞
  • 28
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值