elasticsearch 成立时间均值_时间序列的预处理01

概率分布概率分布的意义随机变量族的统计特性完全由它们的联合分布函数或联合密度函数决定时间序列概率分布族的定义实际应用的局限性 在实际应用中, 要得到序列的联合概率分布几乎是不可能的, 而且联合概率分布通常涉及非常复杂的数学运算, 这些原因导致我们很少直接使用联合概率分布进行时间序列分析时间序列的概率看法为了研究时间序列数据,就要使用科学的工具和方法,主要是概率和统计,利用概率构建时间序列的直观,...
摘要由CSDN通过智能技术生成

概率分布

概率分布的意义

随机变量族的统计特性完全由它们的联合分布函数或联合密度函数决定

时间序列概率分布族的定义

29e09bfffe37412b880ba641dbcd0059.png
  • 实际应用的局限性

在实际应用中, 要得到序列的联合概率分布几乎是不可能的, 而且联合概率分布通常涉及非常复杂的数学运算, 这些原因导致我们很少直接使用联合概率分布进行时间序列分析

时间序列的概率看法

为了研究时间序列数据,就要使用科学的工具和方法,主要是概率和统计,利用概率构建时间序列的直观,利用统计构建时间序列模型拟合数据。

概率上,时间序列的每一个时 点都被视为一个随机变量。因此时间序列整体就被视为若干个随机变量的按时间排列的集合。而我们观测到的数据就是这些随机变量的一组观测样本。

569f4cfbef12d4c0341e3cd33c30977c.png

序列不同时点间的关联就可以利用随机变量之间的相关性刻画

特征统计量

均值

ff2628e82e0f8eec978b39d14553c678.png

方差

35c36c3c2ce1121e3d5d8bce8ae7691e.png

自协方差

e2dcfedfa00ce54bcb68a3a0c3a35dbb.png

自相关系数

79b84cdc0ed6f535faa2117e903ac10b.png

平稳时间序列的定义

  • 严平稳

严平稳是一种条件比较苛刻的平稳性定义,它认为只有当序列所有的统计性质都不会随着时间的推移而发生变化时,该序列才能被认为平稳。

  • 宽平稳

宽平稳是使用序列的特征统计量来定义的一种平稳性。它认为序列的统计性质主要由它的低阶矩决定,所以只要保证序列低阶矩平稳(二阶),就能保证序列的主要性质近似稳定。

平稳时间序列的统计定义

  • 严平稳,
  • 满足如下条件的序列称为严平稳序列

da4d23bc67d0973a965ed03ff4007163.png

99c2ca364b4c631ce26ecb6f5f136037.png

简单讲,如果任意有限维分布具有平移不变性, 则时间序列是严平稳的.

  • 宽平稳,
  • 满足如下条件的序列称为宽平稳序列

bc85c2e29bd126f9a02a63831bda0701.png

有限方差的时间序列

若满足以下两点:

(1)均值函数

是不依 赖于t的常数;

(2)自协方差函数

只依赖于时点的间隔

则称时间序列

是(宽)平稳的。

严平稳与宽平稳的关系

  • 一般关系

严平稳条件比宽平稳条件苛刻,通常情况下,严平稳(低阶矩存在)能推出宽平稳成立,而宽平稳序列不能反推严平稳成立

  • 特例

不存在低阶矩的严平稳序列不满足宽平稳条件,例如服从柯西分布的严平稳序列就不是宽平稳序列

当序列服从多元正态分布时,宽平稳可以推出严平稳

平稳时间序列的统计性质

  • 常数均值

自协方差函数和自相关函数只依赖于时间的平移长度而与时间的起止点无关

  • 延迟
    自协方差函数

dd84b46560cd67c3adce2a7fdc7eede8.png
  • 延迟
    自相关系数

509fd3a17d1211ec0ebe297fbe0528db.png

方差

当k=0时,自协方差就是方差,平稳时间序列的方差不随时间变化

dbe2d6b24efe091e5bc1b409617cd899.png

总结:平稳时间序列的期望和方差都是常数,自协方差和 自相关函数是关于时间间隔

的函数

自相关系数的性质

规范性

07f810d9b0d737e42f7d2a90e824eda2.png

对称性

ee7df2107254e0c63431a9c66b1e6575.png

非负定性

2543b38e4490b856e32f3189d8b80dba.png

非唯一性

一个平稳时间序列一定唯一决定了它的自相关函数,但一个自相关函数未必唯一对应着一个平稳时间序列。

时间序列数据结构的特殊性

传统统计分析的数据结构:有限个变量,每个变量有多个观察值

1cdaeee8e8eccfbe1b25492ee7a08bb5.png

时间序列数据结构:可列多个随机变量,而每个变量只有一个样本观察

caed63bd024006e0a069036c6bb855ca.png

平稳性的重大意义

在平稳序列场合,序列的均值等于常数,这意味着原本含有可列多个随机变量的均值序列变成了只含有一个变量的常数序列。

cf0bb7ce269012d03233a193a5ee5028.png

原本每个随机变量的均值(方差,自相关系数)只能依靠唯一的一个样本观察值去估计,现在由于平稳性,每一个统计量都将拥有大量的样本观察值。

这极大地减少了随机变量的个数,并增加了待估变量的样本容量。极大地简化了时序分析的难度,同时也提高了对特征统计量的估计精度

相关性的样本估计

自协方差函数和ACF是理论上刻画一个时间序列相邻项间的相关程度

实际中,面对的是一列样本数值序列,这是时间序列的一 次实现(realization),我们只能依靠样本数据对相关程度做估计

类比统计中,以

作为
的估计,

定义样本自协方差函数为:

30bfdc948d65ef45dd10f860f6e800dd.png

定义样本自相关函数为:

d9c9d3e363a23955ad158a7bd7803811.png

特别的,

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值