时间序列学习笔记(1)

时间序列分析记载1

笔记依据教材时间系列分析及应用,其中也加入自己的一些理解与查找,以此来做到督促学习的目的

目录

模型路径

时域分析:
基础:AR+MA=ARMA
核心:ARIMA(Box-jenkins)
完善:
(异方差)ARCH,GARCH
(多变量)cointeraion
(非线性)门限自回归
时域-频域分析:小波分析

1.基本的小命令

主要是一些基本操作和我不太熟悉的基础代码

#创建一个新的窗口,便于图像等的展示
>win.graph(width=4,height=2,pointsize=8)
#幂的预算
>2**3
>scan(" .dat")#这里用scan函数读取这样格式的文件
read.delim()和read.delim2()也可用于读数据,效率提升。(这其实是read.table的特殊情况)
#r中的基本对象
#向量
>seq(1,6,by=2)
1 2 3 4 5 6
>rep(1,4)
1 1 1 1
#矩阵
> x=matrix(c(1:20),ncol=4,nrow=5)
> x[x>10]
 [1] 11 12 13 14 15 16 17 18 19 20
> x[(x>16)|(x<2)]
[1]  1 17 18 19 20
> x[(x>16)&(x>2)]
[1] 17 18 19 20
#基本函数
*标量abs()绝对值函数prod(2:4)连乘
*向量
> a=c(1:6)
> cumsum(a)#逐点连加
[1]  1  3  6 10 15 21
> cumprod(a)#逐点连乘
[1]   1   2   6  24 120 720
*数组array()
*列表list()
*数据框data.frame()
*时间序列ts()

在雅虎财经上下载数据的方法雅虎财经数据下载

2.基本定义
2.1 随机游动

e i ∼ ( 0 , σ e 2 ) i . i . d e_i\sim (0,\sigma _e^2) i.i.d ei(0,σe2)i.i.d构造观测的时间序列$Y_t=\sum e_i,Y_{t+1}=Y_t+e_{t+1} $(将e看为步长我就可以理解了)
μ t = 0 , v a r ( Y t ) = t σ e 2 , ρ t , s = t s \mu_t=0, var(Y_t)=t\sigma _e^2,\rho_{t,s}=\sqrt{\frac{t}{s}} μt=0,var(Yt)=tσe2,ρt,s=st
可看出随时间的推移,方差增加,相关系数体现相邻点的正相关系数很高,但相邻很远的点相关性变差

x=c(0)
for(i in 1:1000){
  x[i+1]<-x+rnorm(1)
}
plot(x)

注:这里注意,将x的格式定义为向量的处理,将每个点存入

2.2 滑动平均

e t e_t et的假设相同,但 Y t = e t + e t − 1 2 Y_t=\frac{e_t+e_{t-1}}{2} Yt=2et+et1(这里 Y t Y_t Yt的设法体现滑动平均的概念)
μ t = 0 , v a r ( Y t ) = 0.5 σ e 2 , ρ t , s = { 1 ∣ t − s ∣ = 0 0.5 ∣ t − s ∣ = 1 0 o t h e r s \mu_t=0, var(Y_t)=0.5\sigma _e^2,\rho_{t,s}= \{ \begin{array}{rcl} 1& |t-s|=0\\ 0.5& |t-s|=1\\ 0 & others \\ \end{array} μt=0,var(Yt)=0.5σe2,ρt,s={10.50ts=0ts=1others
可以发现,对于所有的t, ρ t , t − k \rho_{t,t-k} ρt,tk相同。平稳

2.3 平稳性

是随机过程中常见的假设。
含义:就是时序点的统计规律(例如分布)不随时间的变化而改变。
分类:
(1)严平稳 ∀ k , t i \forall k,t_i k,ti都有 Y t 1 , Y t 2 , . . . Y t n Y_{t_1},Y_{t_2},...Y_{t_n} Yt1,Yt2,...Ytn Y t 1 − k , Y t 2 − k , . . . Y t n − k Y_{t_1-k},Y_{t_2-k},...Y_{t_n-k} Yt1k,Yt2k,...Ytnk联合分布相同
(2)弱平稳:认为序列的统计性质主要由低阶矩决定,随机过程 { Y t } , E ( Y 2 ) < ∞ \{Y_t\},E(Y^2)<\infty {Yt}EY2<均值函数为常值和 γ t , t − k = γ 0 , k 对 ∀ t , k \gamma_{t,t-k}=\gamma_{0,k}对\forall t,k γt,tk=γ0,kt,k(k表示滞后)这里 γ \gamma γ表示自协方差函数。

严平稳性质:
1. 均值方差恒定
2. γ t , s = γ 0 , ∣ t − s ∣ \gamma_{t,s}=\gamma_{0,|t-s|} γt,s=γ0,ts(只与时间间隔有关)所以写为 γ k = c o v ( Y t , Y t − k ) \gamma_k=cov(Y_t,Y_{t-k}) γk=cov(Yt,Ytk)
3. ρ 0 = 1 , ρ k = ρ − k , ∣ ρ k ∣ ≤ 1 \rho_0=1,\rho_k=\rho_{-k},|\rho_k|\leq1 ρ0=1,ρk=ρk,ρk1
两种平稳的比较:
通常情况下严平稳->弱平稳,反之不可
特例:不存在低阶矩的严平稳不是弱平稳,比如柯西分布。多元正太分布,二者等价。

2.4白噪声

独立同分布的随机变量序列 { e t } \{e_t\} {et},满足严平稳的定义

平稳性在一节中单处理
3.统计上的一些代码

3.1相关系数
衡量随机变量相关性的方法主要有三种:pearson相关系数,spearman相关系数,kendall相关系数
kendall相关系数
比如两个变量x,y,将样本数进行排序,两个样本点之间的顺序值变化符号相同,满足协同性,当满足协同性的对数越多,表示相关性越好
τ = N c − N d n ( n − 1 ) / 2 \tau=\frac{N_c-N_d}{n(n-1)/2} τ=n(n1)/2NcNd其中 N c N_c Nc表示协同对的对数, N d N_d Nd不协同对的对数。(此定义理解参考《管理科学研究方法》)
在统计中我们也可表示为 p τ = P [ ( X − X ^ ) ( Y − Y ^ ) > 0 ] − P [ ( X − X ^ ) ( Y − Y ^ ) < 0 ] p_{\tau}=P[(X-\hat{X})(Y-\hat{Y})>0]-P[(X-\hat{X})(Y-\hat{Y})<0] pτ=P[(XX^)(YY^)>0]P[(XX^)(YY^)<0]
spearman相关系数
同上对于两个变量进行排序处理,当两个样本点之间的对应顺序值相同,表示保持了一致的同增同减趋势,说明了相关性。
在统计中我们也可表示为 ρ s = ρ ( F x ( X ) , F y ( Y ) ) \rho_s=\rho(F_x(X),F_y(Y)) ρs=ρ(Fx(X),Fy(Y))其中F表示累计分布函数。

cor(x,exp(x),method="kendall")

如果对本章节相关内容有疑问,更多精彩可见
在这里插入图片描述
此贴为原创,转载需注明出处和作者

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
近十年来,研究者分析时间序列数据的方式发生了巨大变化。这本十分必需的书归纳了这一日益重要领域的主要最新进展,并就其现有表述给出了一个单一的一致的表示。汉密尔顿就诸如向量自回归、广义矩方法估计、单位根的经济和统计结果、随时间变化的方差以及非线性时间序列模型等重要创新,首次给出了一本完整的和详细的教科书。另外,汉密尔顿还介绍了动态系统分析的传统工具,如线性表示、自协方差、生成函数、谱分析以及卡尔曼滤子,并介绍了它们在经济理论以及研究并解释真实一世界数据两方面的用途。 本书的目的在于为学生、研究者和预测者提供关于动态系统、经济计量学和时间序列分析方面的概览。从第一个原理开始,汉密尔顿的明析介绍使得新旧进展皆适合于大学一年级学生和非专业人员。另外,时间序列分析从内容的广度和深度上使其成为该领域前沿研究者不可多得的一本参考书。汉密尔顿通过大量的数值例子解释理论结果如何在实践中运用并将大量推导细节放在每章末的数学附录中,以此达到了上述双重目的。本书为该领域的学生和研究者提供了一个路径地图,相信在未来几年内它都会是较权威的指南。 詹姆斯D.汉密尔顿是加利福尼亚大学圣地亚哥分校的经济学教授。他获得了加利福尼亚大学伯克利分校的博士学位,并曾在弗吉尼亚大学任教。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值