时间序列分析记载1
笔记依据教材时间系列分析及应用,其中也加入自己的一些理解与查找,以此来做到督促学习的目的
目录
文章目录
模型路径
时域分析:
基础:AR+MA=ARMA
核心:ARIMA(Box-jenkins)
完善:
(异方差)ARCH,GARCH
(多变量)cointeraion
(非线性)门限自回归
时域-频域分析:小波分析
1.基本的小命令
主要是一些基本操作和我不太熟悉的基础代码
#创建一个新的窗口,便于图像等的展示
>win.graph(width=4,height=2,pointsize=8)
#幂的预算
>2**3
>scan(" .dat")#这里用scan函数读取这样格式的文件
read.delim()和read.delim2()也可用于读数据,效率提升。(这其实是read.table的特殊情况)
#r中的基本对象
#向量
>seq(1,6,by=2)
1 2 3 4 5 6
>rep(1,4)
1 1 1 1
#矩阵
> x=matrix(c(1:20),ncol=4,nrow=5)
> x[x>10]
[1] 11 12 13 14 15 16 17 18 19 20
> x[(x>16)|(x<2)]
[1] 1 17 18 19 20
> x[(x>16)&(x>2)]
[1] 17 18 19 20
#基本函数
*标量abs()绝对值函数prod(2:4)连乘
*向量
> a=c(1:6)
> cumsum(a)#逐点连加
[1] 1 3 6 10 15 21
> cumprod(a)#逐点连乘
[1] 1 2 6 24 120 720
*数组array()
*列表list()
*数据框data.frame()
*时间序列ts()
在雅虎财经上下载数据的方法雅虎财经数据下载
2.基本定义
2.1 随机游动
e
i
∼
(
0
,
σ
e
2
)
i
.
i
.
d
e_i\sim (0,\sigma _e^2) i.i.d
ei∼(0,σe2)i.i.d构造观测的时间序列$Y_t=\sum e_i,Y_{t+1}=Y_t+e_{t+1} $(将e看为步长我就可以理解了)
μ
t
=
0
,
v
a
r
(
Y
t
)
=
t
σ
e
2
,
ρ
t
,
s
=
t
s
\mu_t=0, var(Y_t)=t\sigma _e^2,\rho_{t,s}=\sqrt{\frac{t}{s}}
μt=0,var(Yt)=tσe2,ρt,s=st
可看出随时间的推移,方差增加,相关系数体现相邻点的正相关系数很高,但相邻很远的点相关性变差
x=c(0)
for(i in 1:1000){
x[i+1]<-x+rnorm(1)
}
plot(x)
注:这里注意,将x的格式定义为向量的处理,将每个点存入
2.2 滑动平均
e
t
e_t
et的假设相同,但
Y
t
=
e
t
+
e
t
−
1
2
Y_t=\frac{e_t+e_{t-1}}{2}
Yt=2et+et−1(这里
Y
t
Y_t
Yt的设法体现滑动平均的概念)
μ
t
=
0
,
v
a
r
(
Y
t
)
=
0.5
σ
e
2
,
ρ
t
,
s
=
{
1
∣
t
−
s
∣
=
0
0.5
∣
t
−
s
∣
=
1
0
o
t
h
e
r
s
\mu_t=0, var(Y_t)=0.5\sigma _e^2,\rho_{t,s}= \{ \begin{array}{rcl} 1& |t-s|=0\\ 0.5& |t-s|=1\\ 0 & others \\ \end{array}
μt=0,var(Yt)=0.5σe2,ρt,s={10.50∣t−s∣=0∣t−s∣=1others
可以发现,对于所有的t,
ρ
t
,
t
−
k
\rho_{t,t-k}
ρt,t−k相同。平稳
2.3 平稳性
是随机过程中常见的假设。
含义:就是时序点的统计规律(例如分布)不随时间的变化而改变。
分类:
(1)严平稳
∀
k
,
t
i
\forall k,t_i
∀k,ti都有
Y
t
1
,
Y
t
2
,
.
.
.
Y
t
n
Y_{t_1},Y_{t_2},...Y_{t_n}
Yt1,Yt2,...Ytn与
Y
t
1
−
k
,
Y
t
2
−
k
,
.
.
.
Y
t
n
−
k
Y_{t_1-k},Y_{t_2-k},...Y_{t_n-k}
Yt1−k,Yt2−k,...Ytn−k联合分布相同
(2)弱平稳:认为序列的统计性质主要由低阶矩决定,随机过程
{
Y
t
}
,
E
(
Y
2
)
<
∞
\{Y_t\},E(Y^2)<\infty
{Yt},E(Y2)<∞均值函数为常值和
γ
t
,
t
−
k
=
γ
0
,
k
对
∀
t
,
k
\gamma_{t,t-k}=\gamma_{0,k}对\forall t,k
γt,t−k=γ0,k对∀t,k(k表示滞后)这里
γ
\gamma
γ表示自协方差函数。
严平稳性质:
1. 均值方差恒定
2.
γ
t
,
s
=
γ
0
,
∣
t
−
s
∣
\gamma_{t,s}=\gamma_{0,|t-s|}
γt,s=γ0,∣t−s∣(只与时间间隔有关)所以写为
γ
k
=
c
o
v
(
Y
t
,
Y
t
−
k
)
\gamma_k=cov(Y_t,Y_{t-k})
γk=cov(Yt,Yt−k)
3.
ρ
0
=
1
,
ρ
k
=
ρ
−
k
,
∣
ρ
k
∣
≤
1
\rho_0=1,\rho_k=\rho_{-k},|\rho_k|\leq1
ρ0=1,ρk=ρ−k,∣ρk∣≤1
两种平稳的比较:
通常情况下严平稳->弱平稳,反之不可
特例:不存在低阶矩的严平稳不是弱平稳,比如柯西分布。多元正太分布,二者等价。
2.4白噪声
独立同分布的随机变量序列 { e t } \{e_t\} {et},满足严平稳的定义
平稳性在一节中单处理
3.统计上的一些代码
3.1相关系数
衡量随机变量相关性的方法主要有三种:pearson相关系数,spearman相关系数,kendall相关系数
kendall相关系数
比如两个变量x,y,将样本数进行排序,两个样本点之间的顺序值变化符号相同,满足协同性,当满足协同性的对数越多,表示相关性越好
τ
=
N
c
−
N
d
n
(
n
−
1
)
/
2
\tau=\frac{N_c-N_d}{n(n-1)/2}
τ=n(n−1)/2Nc−Nd其中
N
c
N_c
Nc表示协同对的对数,
N
d
N_d
Nd不协同对的对数。(此定义理解参考《管理科学研究方法》)
在统计中我们也可表示为
p
τ
=
P
[
(
X
−
X
^
)
(
Y
−
Y
^
)
>
0
]
−
P
[
(
X
−
X
^
)
(
Y
−
Y
^
)
<
0
]
p_{\tau}=P[(X-\hat{X})(Y-\hat{Y})>0]-P[(X-\hat{X})(Y-\hat{Y})<0]
pτ=P[(X−X^)(Y−Y^)>0]−P[(X−X^)(Y−Y^)<0]
spearman相关系数
同上对于两个变量进行排序处理,当两个样本点之间的对应顺序值相同,表示保持了一致的同增同减趋势,说明了相关性。
在统计中我们也可表示为
ρ
s
=
ρ
(
F
x
(
X
)
,
F
y
(
Y
)
)
\rho_s=\rho(F_x(X),F_y(Y))
ρs=ρ(Fx(X),Fy(Y))其中F表示累计分布函数。
cor(x,exp(x),method="kendall")
如果对本章节相关内容有疑问,更多精彩可见
此贴为原创,转载需注明出处和作者