Jarque-Bera检验:检验序列是否符合正态分布
背景
Jarque-Bera检验
是一种总体分布的正态性检验。
当序列服从正态分布时,JB统计量:
JB=n(S26+(K−3)224)
J
B
=
n
(
S
2
6
+
(
K
−
3
)
2
24
)
渐近服从 χ2(2) χ 2 ( 2 ) 分布。
其中: n n 为样本规模,分别为随机变量的偏度和峰度,计算公式如下:
M2=∑i(xi−x¯¯¯)2n
M
2
=
∑
i
(
x
i
−
x
¯
)
2
n
S=∑i(xi−x¯¯¯)3nM21.5
S
=
∑
i
(
x
i
−
x
¯
)
3
n
M
2
1.5
K=∑i(xi−x¯¯¯)4nM22
K
=
∑
i
(
x
i
−
x
¯
)
4
n
M
2
2
python的sicipy.stats中偏度和峰度的调用的函数为
stats.skew(y)
、
stats.kurtosis(y)
,其中峰度的公式为
K=∑i(xi−x¯¯¯)4nM22−3
K
=
∑
i
(
x
i
−
x
¯
)
4
n
M
2
2
−
3
在
excel
中,偏度和峰度的计算公式如下:
S=n(n−1)(n−2)∑i(xi−x¯¯¯std)3 S = n ( n − 1 ) ( n − 2 ) ∑ i ( x i − x ¯ s t d ) 3
K=n(n+1)(n−1)(n−2)(n−3)∑i(xi−x¯¯¯std)4−3(n−1)2(n−2)(n−3) K = n ( n + 1 ) ( n − 1 ) ( n − 2 ) ( n − 3 ) ∑ i ( x i − x ¯ s t d ) 4 − 3 ( n − 1 ) 2 ( n − 2 ) ( n − 3 )
代码
实现一遍python的scipy库中计算偏度和斜的公式及建立正态分布检验。
import numpy as np
import scipy.stats as stats
def self_JBtest(y):
# 样本规模n
n = y.size
y_ = y - y.mean()
"""
M2:二阶中心钜
skew 偏度 = 三阶中心矩 与 M2^1.5的比
krut 峰值 = 四阶中心钜 与 M2^2 的比
"""
M2 = np.mean(y_**2)
skew = np.mean(y_**3)/M2**1.5
krut = np.mean(y_**4)/M2**2
"""
计算JB统计量,以及建立假设检验
"""
JB = n*(skew**2/6 + (krut-3 )**2/24)
pvalue = 1 - stats.chi2.cdf(JB,df=2)
print("偏度:",stats.skew(y),skew)
print("峰值:",stats.kurtosis(y)+3,krut)
print("JB检验:",stats.jarque_bera(y))
return np.array([JB,pvalue])
y1 = stats.norm.rvs(size=10)
y2 = stats.t.rvs(size=1000,df=4)
print(self_JBtest(y1))
print(self_JBtest(y2))
结果
=============== RESTART: C:\Users\tinysoft\Desktop\JB正态性检验.py ===============
偏度: 0.5383125387398069 0.53831253874
峰值: 2.9948926317585918 2.99489263176
JB检验: (0.48297818444514068, 0.78545737133644544)
[ 0.48297818 0.78545737]
偏度: -1.0488825341925703 -1.04888253419
峰值: 13.40804986639119 13.4080498664
JB检验: (4697.0050126426095, 0.0)
[ 4697.00501264 0. ]