概率分布的意义
随机变量族的统计特性完全由它们的联合分布函数或联合密度函数决定
时间序列概率分布族的定义
![29e09bfffe37412b880ba641dbcd0059.png](https://i-blog.csdnimg.cn/blog_migrate/e3717aa19fdb6a606b50fca004f93e05.png)
- 实际应用的局限性
在实际应用中, 要得到序列的联合概率分布几乎是不可能的, 而且联合概率分布通常涉及非常复杂的数学运算, 这些原因导致我们很少直接使用联合概率分布进行时间序列分析
时间序列的概率看法
为了研究时间序列数据,就要使用科学的工具和方法,主要是概率和统计,利用概率构建时间序列的直观,利用统计构建时间序列模型拟合数据。
概率上,时间序列的每一个时 点都被视为一个随机变量。因此时间序列整体就被视为若干个随机变量的按时间排列的集合。而我们观测到的数据就是这些随机变量的一组观测样本。
![569f4cfbef12d4c0341e3cd33c30977c.png](https://i-blog.csdnimg.cn/blog_migrate/fcaa1b42ba6522e33b936729643b9c8d.png)
序列不同时点间的关联就可以利用随机变量之间的相关性刻画
特征统计量
均值
![ff2628e82e0f8eec978b39d14553c678.png](https://i-blog.csdnimg.cn/blog_migrate/44203bd21d76e5e9aa5a647f4317d9fd.png)
方差
![35c36c3c2ce1121e3d5d8bce8ae7691e.png](https://i-blog.csdnimg.cn/blog_migrate/e14efdc5819f9e529b084b1434d2b6b2.png)
自协方差
![e2dcfedfa00ce54bcb68a3a0c3a35dbb.png](https://i-blog.csdnimg.cn/blog_migrate/e137053f96e4c13fd196e8e7284b204a.png)
自相关系数
![79b84cdc0ed6f535faa2117e903ac10b.png](https://i-blog.csdnimg.cn/blog_migrate/13fed6287a658483df49f36af91f8b81.png)
平稳时间序列的定义
- 严平稳
严平稳是一种条件比较苛刻的平稳性定义,它认为只有当序列所有的统计性质都不会随着时间的推移而发生变化时,该序列才能被认为平稳。
- 宽平稳
宽平稳是使用序列的特征统计量来定义的一种平稳性。它认为序列的统计性质主要由它的低阶矩决定,所以只要保证序列低阶矩平稳(二阶),就能保证序列的主要性质近似稳定。
平稳时间序列的统计定义
- 严平稳,
- 满足如下条件的序列称为严平稳序列
![da4d23bc67d0973a965ed03ff4007163.png](https://i-blog.csdnimg.cn/blog_migrate/93bc9fd9a9d14c08cf07f07903c1517d.png)
![99c2ca364b4c631ce26ecb6f5f136037.png](https://i-blog.csdnimg.cn/blog_migrate/9d0718f2a3a55355935e886ee8abe834.png)
简单讲,如果任意有限维分布具有平移不变性, 则时间序列是严平稳的.
- 宽平稳,
- 满足如下条件的序列称为宽平稳序列
![bc85c2e29bd126f9a02a63831bda0701.png](https://i-blog.csdnimg.cn/blog_migrate/dc0919d891c53918792788140521fdb7.png)
有限方差的时间序列
(1)均值函数
(2)自协方差函数
则称时间序列
严平稳与宽平稳的关系
- 一般关系
严平稳条件比宽平稳条件苛刻,通常情况下,严平稳(低阶矩存在)能推出宽平稳成立,而宽平稳序列不能反推严平稳成立
- 特例
不存在低阶矩的严平稳序列不满足宽平稳条件,例如服从柯西分布的严平稳序列就不是宽平稳序列
当序列服从多元正态分布时,宽平稳可以推出严平稳
平稳时间序列的统计性质
- 常数均值
自协方差函数和自相关函数只依赖于时间的平移长度而与时间的起止点无关
- 延迟
自协方差函数
![dd84b46560cd67c3adce2a7fdc7eede8.png](https://i-blog.csdnimg.cn/blog_migrate/551eebfaca6c0439316fe3c7cf7797ca.png)
- 延迟
自相关系数
![509fd3a17d1211ec0ebe297fbe0528db.png](https://i-blog.csdnimg.cn/blog_migrate/59c23006c71f6450c6039e3a5598d9f4.png)
方差
当k=0时,自协方差就是方差,平稳时间序列的方差不随时间变化
![dbe2d6b24efe091e5bc1b409617cd899.png](https://i-blog.csdnimg.cn/blog_migrate/f5dd05395f69a6f78a0f0e3e38009184.png)
总结:平稳时间序列的期望和方差都是常数,自协方差和 自相关函数是关于时间间隔
自相关系数的性质
规范性
![07f810d9b0d737e42f7d2a90e824eda2.png](https://i-blog.csdnimg.cn/blog_migrate/41327058a100291f63c22d32161727ba.png)
对称性
![ee7df2107254e0c63431a9c66b1e6575.png](https://i-blog.csdnimg.cn/blog_migrate/a4e1980acd02d6377f71e6d4cc2eccda.png)
非负定性
![2543b38e4490b856e32f3189d8b80dba.png](https://i-blog.csdnimg.cn/blog_migrate/7ca4ffa2ac8e5693043c487e76e4735f.png)
非唯一性
一个平稳时间序列一定唯一决定了它的自相关函数,但一个自相关函数未必唯一对应着一个平稳时间序列。
时间序列数据结构的特殊性
传统统计分析的数据结构:有限个变量,每个变量有多个观察值
![1cdaeee8e8eccfbe1b25492ee7a08bb5.png](https://i-blog.csdnimg.cn/blog_migrate/f3faf2b2e3e290dd428aab2bd9f44627.png)
时间序列数据结构:可列多个随机变量,而每个变量只有一个样本观察
![caed63bd024006e0a069036c6bb855ca.png](https://i-blog.csdnimg.cn/blog_migrate/1362c513f5aa05161948305b15285f89.png)
平稳性的重大意义
在平稳序列场合,序列的均值等于常数,这意味着原本含有可列多个随机变量的均值序列变成了只含有一个变量的常数序列。
![cf0bb7ce269012d03233a193a5ee5028.png](https://i-blog.csdnimg.cn/blog_migrate/0232bd3acf8d68050566136953891879.png)
原本每个随机变量的均值(方差,自相关系数)只能依靠唯一的一个样本观察值去估计,现在由于平稳性,每一个统计量都将拥有大量的样本观察值。
这极大地减少了随机变量的个数,并增加了待估变量的样本容量。极大地简化了时序分析的难度,同时也提高了对特征统计量的估计精度
相关性的样本估计
自协方差函数和ACF是理论上刻画一个时间序列相邻项间的相关程度
实际中,面对的是一列样本数值序列,这是时间序列的一 次实现(realization),我们只能依靠样本数据对相关程度做估计
类比统计中,以
定义样本自协方差函数为:
![30bfdc948d65ef45dd10f860f6e800dd.png](https://i-blog.csdnimg.cn/blog_migrate/0da2e0524a0e2dbad45931265d52c479.png)
定义样本自相关函数为:
![d9c9d3e363a23955ad158a7bd7803811.png](https://i-blog.csdnimg.cn/blog_migrate/a84a0679d63339a9bd16f2e98ebd602d.png)
特别的,