此篇笔记主要是实践,没有涉及到具体的原理。
雅克贝拉检验
假设检验步骤:
一,H0:该随机变量服从正态分布,H1:不服从正态分布
二,计算该变量的偏度S与峰度K,根据公式计算JB*,计算得到相应的p值
三,将p值与0.05比较,若小于0.05则可拒绝原假设,否则不能拒绝原假设(默认置信水平为0.95)
峰度K与偏度S计算公式:
MATLAB计算代码:
x = normrnd(2,3,100,1); % 生成100*1的随机向量,每个元素是均值为2,标准差为3的正态分布
skewness(x) %偏度
kurtosis(x) %峰度
JB统计量计算公式:
若{xi}为正态分布,则在大样本情况下JB~X^2(2)(即满足自由度为2的开方分布)
MATLAB代码:
clear;clc;
load 'physical fitness test.mat' %文件名如果有空格隔开,那么需要加引号
n_c = size(Test,2);
H = zeros(1,n_c);
P = zeros(1,n_c);
for i = 1:n_c
[h,p] = jbtest(Test(:,i),0.05) % 参数:测试数据,显著性水平,返回值为[布尔值,概率p]
H(i) = h; % 若检验得到的h为1表示非正态分布,0则满足正态分布
P(i) = p; % 检验值JB对应的p值,和显著性水平进行进行比较
end
Shapiro-wilk检验
假设检验步骤:
一,H0:该随机变量服从正态分布,H1:不服从正态分布
二,计算该变量的偏度S与峰度K,根据公式计算威尔克统计量,计算得到相应的p值
三,将p值与0.05比较,若小于0.05则可拒绝原假设,否则不能拒绝原假设(默认置信水平为0.95)
局限:适用于3到50之间的小样本
Spss操作:
操作结果:
QQ图检验
在统计学中,Q‐Q图(Q代表分位数Quantile)是一种通过比较两个概率分布的分位数对这两个概率分布进行比较的概率图方法。
首先选定分位数的对应概率区间集合,在此概率区间上,点(x,y)对应于第一个分布的一个分位数x和第二个分布在和x相同概率区间上相同的分位数。
适用范围:数据量几万,总之非常非常大
对于笔者这个没有学过统计学相关知识的小白来说,只看图,成一条直线,就是正态分布
x = normrnd(2,3,10000,1);
qqplot(x);
10000个服从正态分布的数据样本
100个服从正态分布的数据样本,对比发现,数据量非常大时才合适
建模纯小白的笔记,望大佬指点。