多维非线性时间序列的条件互信息图模型
1.多维非线性时间序列条件互信息图的定义
用顶点表示分量序列,用顶点之间的边表示分量序列间存在的相依联系。设
X
t
=
(
X
1
,
t
,
X
2
,
t
,
.
.
.
,
X
k
,
t
)
(
t
∈
Z
)
X_{t}=(X_{1,t} , X_{2,t},...,X_{k,t})(t\in Z)
Xt=(X1,t,X2,t,...,Xk,t)(t∈Z)为一个k维时间序列,表示
X
t
X_{t}
Xt各分量序列之间存在的相依联系的图
G
=
(
V
,
E
)
G=(V,E)
G=(V,E)由顶点集
V
=
(
1
,
2
,
.
.
.
,
k
)
V=(1,2,...,k)
V=(1,2,...,k)和边集
E
⊂
{
(
a
,
b
)
∈
V
×
V
}
E\subset \left \{ (a,b)\in V\times V \right \}
E⊂{(a,b)∈V×V}。此处仅考虑无向图。
令
Y
−
a
b
,
t
=
(
X
j
,
t
)
(
j
≠
a
,
b
)
,
X
a
=
{
X
a
,
t
}
(
t
∈
Z
)
,
Y
−
a
b
=
(
Y
−
a
b
,
t
)
(
t
∈
Z
)
\boldsymbol{Y}_{-ab}, t=\left(X_{j}, t\right)(j \neq a, b), X_{a}=\left\{X_{a, t}\right\}(t \in \mathbf{Z}),\boldsymbol{Y}_{-ab}=(\boldsymbol{Y}_{-ab}, t)(t \in \mathbf{Z})
Y−ab,t=(Xj,t)(j=a,b),Xa={Xa,t}(t∈Z),Y−ab=(Y−ab,t)(t∈Z),考虑检验在给定其他序列
Y
−
a
b
\boldsymbol{Y}_{-ab}
Y−ab的条件下序列
X
a
X_{a}
Xa和
X
b
X_{b}
Xb的条件独立性。由于条件互信息只是一个标量,可以简单考虑条件互信息
I
(
X
a
,
t
;
X
b
,
t
+
u
∣
Y
−
a
b
)
,
其中,
u
∈
Z
.
I\left(X_{a, t} ; X_{b,t+u}\mid Y_{-a b}\right), \text { 其中, } u \in \mathbf{Z} \text { . }
I(Xa,t;Xb,t+u∣Y−ab), 其中, u∈Z .
定义联系
X
a
⊥
X
b
∣
Y
−
a
b
:
⇔
X
a
,
t
⊥
X
b
,
t
+
u
∣
F
−
a
b
:
⇔
I
(
X
a
,
t
;
X
b
,
t
+
u
∣
Y
−
a
b
)
=
0
,
对所有
u
∈
Z
,
\begin{aligned} &X_{a} \perp X_{b}\left|\boldsymbol{Y}_{-a b}: \Leftrightarrow X_{a, t} \perp X_{b, t+u}\right| \mathcal{F}_{-a b}\\ &: \Leftrightarrow I\left(X_{a, t} ; X_{b, t+u} \mid \boldsymbol{Y}_{-a b}\right)=0, \quad \text { 对所有 } u \in \mathbf{Z}, \end{aligned}
Xa⊥Xb∣Y−ab:⇔Xa,t⊥Xb,t+u∣F−ab:⇔I(Xa,t;Xb,t+u∣Y−ab)=0, 对所有 u∈Z,
式中,
F
−
a
b
\mathcal{F}_{-a b}
F−ab表示过程
Y
−
a
b
\boldsymbol{Y}_{-ab}
Y−ab产生的
σ
\sigma
σ代数。由这个联系可以导出下面条件互信息图的定义。
条件互信息图定义
设 X t = ( X 1 , t , X 2 , t , . . . , X k , t ) ( t ∈ Z ) X_{t}=(X_{1,t} , X_{2,t},...,X_{k,t})(t\in Z) Xt=(X1,t,X2,t,...,Xk,t)(t∈Z)为一个k维时间序列, V = ( 1 , 2 , . . . , k ) V=(1,2,...,k) V=(1,2,...,k)是各分量序列对应的顶点集。设 ( a , b ) ∉ E (a,b)\notin E (a,b)∈/E当且仅当条件 X a ⊥ X b ∣ Y − a b X_{a} \perp X_{b}|\boldsymbol{Y}_{-a b} Xa⊥Xb∣Y−ab成立。则称图 G = ( V , E ) G=(V,E) G=(V,E)为条件互信息图。偏不相关关系是条件独立关系的一种线性特例。条件互信息度量数据中所有(包括线性和非线性)的联系,而偏相关关系仅度量线性关系,偏相关图是条件互信息图的一种特例。
2.多维非线性时间序列条件互信息图的Markov性质
对任意向量序列
X
A
=
(
X
a
,
t
)
(
a
∈
A
,
t
∈
Z
)
X_{A}=(X_{a},t)(a\in A,t\in Z)
XA=(Xa,t)(a∈A,t∈Z)可以用相同的方式定义联系
⊥
\perp
⊥,特别有:
X
a
⊥
X
b
⊥
X
c
:
⇔
X
A
,
t
⊥
X
B
,
t
+
u
∣
F
C
=
0
:
⇔
I
(
X
A
,
t
;
X
B
,
t
+
u
∣
F
C
)
=
0
,
对所有
u
∈
Z
,
\begin{aligned} &X_{a} \perp X_{b} \perp X_{c} : \Leftrightarrow X_{A, t} \perp X_{B, t+u} | \mathcal{F}_{C}=0\\ &: \Leftrightarrow I\left(X_{A, t} ; X_{B, t+u} \mid \mathcal{F}_{C}\right)=0, \quad \text { 对所有 } u \in \mathbf{Z}, \end{aligned}
Xa⊥Xb⊥Xc:⇔XA,t⊥XB,t+u∣FC=0:⇔I(XA,t;XB,t+u∣FC)=0, 对所有 u∈Z,
u
∈
Z
,
A
,
B
,
C
⊂
V
u\in Z,A,B,C\subset V
u∈Z,A,B,C⊂V为不交子集。
引理9 设 X t = ( X a , t ) ( a ∈ V ) X_{t}=(X_{a},t)(a\in V) Xt=(Xa,t)(a∈V)为一个多维严平稳时间序列,有 X A = ( X a , t ) ( a ∈ V , t ∈ Z ) \mathbf{X} _{A}=(X_{a},t)(a\in V,t\in \mathbf{Z} ) XA=(Xa,t)(a∈V,t∈Z), X B , X C , X D \mathbf{X} _{B},\mathbf{X} _{C},\mathbf{X} _{D} XB,XC,XD为其子序列,其中 A , B , C , D ⊂ V A,B,C,D\subset V A,B,C,D⊂V为不交子集,则
- 如果 X A ⊥ ( X B , X C ) ∣ X D X_{A}\perp (X_{B},X_{C})|X_{D} XA⊥(XB,XC)∣XD,那么 X A ⊥ X B ∣ X D X_{A}\perp X_{B}|X_{D} XA⊥XB∣XD;
- X A ⊥ ( X B , X C ) ∣ X D X_{A}\perp (X_{B},X_{C})|X_{D} XA⊥(XB,XC)∣XD,当且仅当 X A ⊥ X B ∣ ( X C , X D ) X_{A}\perp X_{B}|(X_{C},X_{D}) XA⊥XB∣(XC,XD)和 X A ⊥ X C ∣ ( X B , X D ) X_{A}\perp X_{C}|(X_{B},X_{D}) XA⊥XC∣(XB,XD)
条件互信息图的分离定理
对于 A , B , S ⊂ V A,B,S\subset V A,B,S⊂V,如果从 A A A中任意元素到 B B B中任意元素的每条路都至少包含分离集 S S S中的一个顶点,则称 S S S分离 A A A和 B B B.
定理10 设
X
t
\mathbf{X}_{t}
Xt是一个多维严平稳时间序列,且满足可测分离条件,图
G
=
(
V
,
E
)
G=(V,E)
G=(V,E)是
X
t
\mathbf{X}_{t}
Xt的条件互信息图。令
A
,
B
,
S
⊂
V
A,B,S\subset V
A,B,S⊂V,其中
S
S
S分离
A
A
A和
B
B
B,则
X
A
⊥
X
B
∣
X
S
X_{A}\perp X_{B}| X_{S}
XA⊥XB∣XS
2.多维非线性时间序列分量序列的条件独立性检验
在给定
Y
−
a
b
\boldsymbol{Y}_{-ab}
Y−ab的条件下,
X
a
,
t
X_{a,t}
Xa,t和
b
,
t
+
u
_{b,t+u}
b,t+u条件独立等价于:
δ
a
b
(
u
)
=
1
−
e
x
p
[
−
I
(
X
a
,
t
,
X
b
,
t
+
u
∣
Y
−
a
b
)
]
=
0
\delta_{ab}(u)=1-exp[-I(X_{a,t},X_{b,t+u}|\mathbf{Y}_{-ab})]=0
δab(u)=1−exp[−I(Xa,t,Xb,t+u∣Y−ab)]=0
在实际应用中,对于
Y
−
a
b
\mathbf{Y}_{-ab}
Y−ab常同时考虑有限个滞后变量,如
I
(
X
a
,
t
,
X
b
,
t
+
u
∣
Y
−
a
b
L
)
I(X_{a,t},X_{b,t+u}|\mathbf{Y}_{-ab}^{L} )
I(Xa,t,Xb,t+u∣Y−abL)。对于之后阶数
u
∈
{
−
M
,
.
.
.
,
−
1
,
0
,
1
,
.
.
.
,
M
}
u\in \left \{ -M,...,-1,0,1,...,M \right \}
u∈{−M,...,−1,0,1,...,M}:
当
u
≥
0
,
Y
−
a
b
L
=
(
Y
−
a
b
,
t
−
L
,
Y
−
a
b
,
t
−
L
+
1
,
.
.
.
,
Y
a
b
,
t
+
u
+
L
)
u\ge 0,\mathbf{Y} _{-ab}^{L}=(\mathbf{Y} _{-ab,t-L},\mathbf{Y} _{-ab,t-L+1},...,\mathbf{Y} _{ab,t+u+L})
u≥0,Y−abL=(Y−ab,t−L,Y−ab,t−L+1,...,Yab,t+u+L)
当
u
<
0
,
Y
−
a
b
L
=
(
Y
a
b
,
t
+
u
−
L
,
Y
a
b
,
t
+
u
−
L
+
1
,
.
.
.
,
Y
a
b
,
t
+
L
)
u< 0,\mathbf{Y} _{-ab}^{L}=(\mathbf{Y} _{ab,t+u-L},\mathbf{Y} _{ab,t+u-L+1},...,\mathbf{Y} _{ab,t+L})
u<0,Y−abL=(Yab,t+u−L,Yab,t+u−L+1,...,Yab,t+L)
其中,常数
L
L
L和
M
M
M为事先确定的固定正整数,用于选择滞后集。
因此,时间序列之间条件独立性的度量为
D
a
b
=
∑
u
=
−
M
M
δ
a
b
(
u
)
D_{ab}=\sum_{u=-M}^{M}\delta_{ab}(u)
Dab=u=−M∑Mδab(u)
δ
a
b
(
u
)
=
1
−
e
x
p
[
−
I
(
X
a
,
t
,
X
b
,
t
+
u
∣
Y
−
a
b
)
]
\delta_{ab}(u)=1-exp[-I(X_{a,t},X_{b,t+u}|\mathbf{Y}_{-ab})]
δab(u)=1−exp[−I(Xa,t,Xb,t+u∣Y−ab)]
在给定
Y
−
a
b
L
\mathbf{Y}_{-ab}^{L}
Y−abL的条件下,
X
a
,
t
X_{a,t}
Xa,t和
X
b
,
t
+
u
X_{b,t+u}
Xb,t+u之间的2阶条件互信息为:
I
2
(
X
a
,
t
;
X
b
,
t
+
u
∣
Y
−
a
b
L
)
=
H
2
(
X
a
,
t
,
X
b
,
t
+
u
∣
Y
−
a
b
L
)
+
H
2
(
X
a
,
t
,
Y
−
a
b
L
)
−
H
2
(
X
b
,
t
+
u
,
Y
−
a
b
L
)
−
H
2
(
Y
−
a
b
L
)
I_{2}(X_{a,t};X_{b,t+u}|\mathbf{Y}_{-ab}^{L})=H_{2}(X_{a,t},X_{b,t+u}|\mathbf{Y}_{-ab}^{L})+H_{2}(X_{a,t},\mathbf{Y}_{-ab}^{L})-H_{2}(X_{b,t+u},\mathbf{Y}_{-ab}^{L})-H_{2}(\mathbf{Y}_{-ab}^{L})
I2(Xa,t;Xb,t+u∣Y−abL)=H2(Xa,t,Xb,t+u∣Y−abL)+H2(Xa,t,Y−abL)−H2(Xb,t+u,Y−abL)−H2(Y−abL)
令
C
U
,
C
a
b
u
,
C
a
u
,
C
b
u
C^{U},C_{ab}^{u},C_{a}^{u},C_{b}^{u}
CU,Cabu,Cau,Cbu分别为关联积分
C
(
Y
−
a
b
L
;
ε
)
,
C
(
X
a
,
t
,
X
b
,
t
+
u
,
Y
−
a
b
L
;
ε
)
,
C
(
X
a
,
t
,
Y
−
a
b
L
;
ε
)
,
C
(
X
b
,
t
+
u
,
Y
−
a
b
L
;
ε
)
C(\mathbf{Y}_{-ab}^{L};\varepsilon),C(X_{a,t},X_{b,t+u},\mathbf{Y}_{-ab}^{L};\varepsilon),C(X_{a,t},\mathbf{Y}_{-ab}^{L};\varepsilon),C(X_{b,t+u},\mathbf{Y}_{-ab}^{L};\varepsilon)
C(Y−abL;ε),C(Xa,t,Xb,t+u,Y−abL;ε),C(Xa,t,Y−abL;ε),C(Xb,t+u,Y−abL;ε)的简写形式,则
δ
^
a
b
(
u
)
=
1
−
e
x
p
[
−
I
^
2
(
X
a
,
t
,
X
b
,
t
+
u
∣
Y
−
a
b
L
)
]
=
1
−
C
^
a
u
C
^
b
u
C
^
u
C
^
a
b
u
\hat{\delta}_{ab}(u)=1-exp[-\hat{I}_{2}(X_{a,t},X_{b,t+u}|\mathbf{Y}_{-ab}^{L})]=1-\frac{\hat{C}_{a}^{u}\hat{C}_{b}^{u}}{\hat{C}^{u}\hat{C}_{ab}^{u}}
δ^ab(u)=1−exp[−I^2(Xa,t,Xb,t+u∣Y−abL)]=1−C^uC^abuC^auC^bu
因此有
D
^
a
b
=
∑
u
=
−
M
M
δ
^
a
b
(
u
)
\hat{D}_{ab}=\sum_{u=-M}^{M}\hat{\delta}_{ab}(u)
D^ab=∑u=−MMδ^ab(u)
定理11 估计 δ ^ a b ( u ) \hat{\delta}_{ab}(u) δ^ab(u)和 D ^ a b \hat{D}_{ab} D^ab分别是 δ a b ( u ) , D a b \delta _{ab}(u),D_{ab} δab(u),Dab的相合估计,即当样本量 n → ∞ n\to \infty n→∞时,有 δ ^ a b ( u ) → P δ a b ( u ) , D ^ a b → P D a b \hat{\delta}_{ab}(u)\overset{P}{\rightarrow}\delta_{ab}(u),\hat{D}_{ab}\overset{P}{\rightarrow}D_{ab} δ^ab(u)→Pδab(u),D^ab→PDab,其中 → P \overset{P}{\rightarrow} →P表示依概率收敛。
定理12 在 X t = ( X 1 , t , X 2 , t , . . . , X k , t ) ( t ∈ Z ) X_{t}=(X_{1,t} , X_{2,t},...,X_{k,t})(t\in Z) Xt=(X1,t,X2,t,...,Xk,t)(t∈Z)为独立同分布时间序列的假设下,当样本量 n → ∞ n\to \infty n→∞时, δ ^ a b ( u ) \hat{\delta}_{ab}(u) δ^ab(u)的渐近分布为 n 1 / 2 δ ^ a b ( u ) → d N ( 0 , σ a b n ( u ) ) n^{1/2} \hat{\delta}_{ab}(u)\overset{d}{\rightarrow}N(0,\sigma _{ab}^{n}(u)) n1/2δ^ab(u)→dN(0,σabn(u))。式中, → d \overset{d}{\rightarrow} →d表示依分布收敛。
定理13 在 X t = ( X 1 , t , X 2 , t , . . . , X k , t ) ( t ∈ Z ) X_{t}=(X_{1,t} , X_{2,t},...,X_{k,t})(t\in Z) Xt=(X1,t,X2,t,...,Xk,t)(t∈Z)为独立同分布时间序列的假设下,当样本量 n → ∞ n\to \infty n→∞时, D ^ a b ( u ) \hat{D}_{ab}(u) D^ab(u)的渐近分布为 n 1 / 2 D ^ a b ( u ) → d N ( 0 , σ a b n ) n^{1/2} \hat{D}_{ab}(u)\overset{d}{\rightarrow}N(0,\sigma _{ab}^{n}) n1/2D^ab(u)→dN(0,σabn)。式中, → d \overset{d}{\rightarrow} →d表示依分布收敛。
基于条件互信息统计量检验分量序列之间条件独立性的具体步骤如下:
1.对初始样本序列
x
1
,
x
2
,
.
.
.
,
x
n
x_{1} , x_{2},...,x_{n}
x1,x2,...,xn,计算统计量取值
D
^
a
b
\hat{D}_{ab}
D^ab.
2.从
x
1
,
x
2
,
.
.
.
,
x
n
x_{1} , x_{2},...,x_{n}
x1,x2,...,xn产生置换样本
x
~
1
=
(
x
~
1
,
t
,
x
~
2
,
t
,
.
.
.
,
x
~
k
,
t
)
\tilde{x}_{1}=(\tilde{x}_{1,t},\tilde{x}_{2,t},...,\tilde{x}_{k,t})
x~1=(x~1,t,x~2,t,...,x~k,t)
3.计算
x
~
1
,
t
,
x
~
2
,
t
,
.
.
.
,
x
~
k
,
t
\tilde{x}_{1,t},\tilde{x}_{2,t},...,\tilde{x}_{k,t}
x~1,t,x~2,t,...,x~k,t的检验统计量取值,记为
D
∼
a
b
D\sim _{ab}
D∼ab.
4.步骤2-3重复B次,用B表示得到的置换样本个数。
5.计算检验的单边显著性概率
p
^
a
b
=
1
+
♯
[
D
~
a
b
≥
D
^
a
b
]
1
+
B
\hat{p}_{ab}=\frac{1+\sharp [\tilde{D}_{ab}\ge \hat{D}_{ab}]}{1+B}
p^ab=1+B1+♯[D~ab≥D^ab],式中,
♯
[
D
~
a
b
≥
D
^
a
b
]
\sharp [\tilde{D}_{ab}\ge \hat{D}_{ab}]
♯[D~ab≥D^ab]表示根据B个置换样本计算的
D
~
a
b
\tilde{D}_{ab}
D~ab中大于
D
^
a
b
\hat{D}_{ab}
D^ab的个数。
6.如果
p
^
a
b
≤
α
\hat{p}_{ab}\le \alpha
p^ab≤α,则拒绝分类序列
X
a
X_{a}
Xa和
X
b
X_{b}
Xb之间的条件独立性的原假设,其中
α
\alpha
α表示选定的显著性水平。
条件互信息图G可以按下式建立:
p
^
a
b
≤
α
⇒
(
a
,
b
)
∈
E
,
a
,
b
∈
V
,
a
≠
b
\hat{p}_{ab}\le \alpha\Rightarrow (a,b)\in E,a,b\in V,a\ne b
p^ab≤α⇒(a,b)∈E,a,b∈V,a=b