Jarque-Bera检验:检验序列是否符合正态分布
背景
Jarque-Bera检验是一种总体分布的正态性检验。
当序列服从正态分布时,JB统计量:
JB=n(S26+(K−3)224)JB=n(S26+(K−3)224)
渐近服从χ2(2)χ2(2)分布。
其中:nn为样本规模,分别为随机变量的偏度和峰度,计算公式如下:
M2=∑i(xi−x¯¯¯)2nM2=∑i(xi−x¯)2n
S=∑i(xi−x¯¯¯)3nM21.5S=∑i(xi−x¯)3nM21.5
K=∑i(xi−x¯¯¯)4nM22K=∑i(xi−x¯)4nM22
python的sicipy.stats中偏度和峰度的调用的函数为
stats.skew(y)、stats.kurtosis(y),其中峰度的公式为K=∑i(xi−x¯¯¯)4nM22−3K=∑i(xi−x¯)4nM22−3
在
excel中,偏度和峰度的计算公式如下:
S=n(n−1)(n−2)∑i(xi−x¯¯¯std)3S=n(n−1)(n−2)∑i(xi−x¯std)3
K=n(n+1)(n−1)(n−2)(n−3)∑i(xi−x¯¯¯std)4−3(n−1)2(n−2)(n−3)K=n(n+1)(n−1)(n−2)(n−3)∑i(xi−x¯std)4−3(n−1)2(n−2)(n−3)
代码
实现一遍python的scipy库中计算偏度和斜的公式及建立正态分布检验。
import numpy as np
import scipy.stats as stats
def self_JBtest(y):
# 样本规模n
n = y.size
y_ = y - y.mean()
"""
M2:二阶中心钜
skew 偏度 = 三阶中心矩 与 M2^1.5的比
krut 峰值 = 四阶中心钜 与 M2^2 的比
"""
M2 = np.mean(y_**2)
skew = np.mean(y_**3)/M2**1.5
krut = np.mean(y_**4)/M2**2
"""
计算JB统计量,以及建立假设检验
"""
JB = n*(skew**2/6 + (krut-3 )**2/24)
pvalue = 1 - stats.chi2.cdf(JB,df=2)
print("偏度:",stats.skew(y),skew)
print("峰值:",stats.kurtosis(y)+3,krut)
print("JB检验:",stats.jarque_bera(y))
return np.array([JB,pvalue])
y1 = stats.norm.rvs(size=10)
y2 = stats.t.rvs(size=1000,df=4)
print(self_JBtest(y1))
print(self_JBtest(y2))
结果
=============== RESTART: C:\Users\tinysoft\Desktop\JB正态性检验.py ===============
偏度: 0.5383125387398069 0.53831253874
峰值: 2.9948926317585918 2.99489263176
JB检验: (0.48297818444514068, 0.78545737133644544)
[ 0.48297818 0.78545737]
偏度: -1.0488825341925703 -1.04888253419
峰值: 13.40804986639119 13.4080498664
JB检验: (4697.0050126426095, 0.0)
[ 4697.00501264 0. ]
本文介绍Jarque-Bera检验方法,该方法用于判断数据序列是否符合正态分布。文章提供了偏度和峰度的计算公式,并通过Python代码实现了Jarque-Bera检验过程。
556





