正态性检验

t检验、方差分析(ANOVA)参数检验都有一个共同的前提条件:样本数据必须服从正态分布,即样本数据必须来源于一个正态分布的总体,若样本数据不服从正态分布,就不能用以上参数检验对数据进行分析,而应该使用非参数检验(如卡方检验、置换检验等)

参数检验:t检验、方差分析(ANOVA)
非参数检验:正态检验

1.描述性统计法

图示法:
直方图(with 拟合正态分布曲线)-[注: 数据量少慎用]
QQ图:拟合优度 样本数据直方图和正态分布图之间 (当QQ图上的点都大致落在 一条直线上 \textcolor{pink}{一条直线上} 一条直线上时,表示高度正相关,即这些数据是正态分布的。)

∙ \bullet QQ图
利用Q-Q图来对数据进行正态分布的检验,则可以令x轴为正态分布的分位数,y轴为样本分位数,如果这两者构成的点分布在一条直线上,就证明样本数据与正态分布存在线性相关性,即服从正态分布。 且该直线的斜率为标准差,截距为均值.

2.概率统计法

(1) 基于经验分布函数(empirical distribution function,EDF)
①Kolmogorov–Smirnov test
计算出 经验分布和理论分布 \textcolor{blue}{经验分布和理论分布} 经验分布和理论分布之间的距离,并将其中最大的距离(差异)作为检验统计量
样本量>2000
需要指定总体的均值和方差
⋅ \cdot 可用于检验其他任何分布

②Lilliefors test
通过计算经验分布函数与理想累积分布函数 \textcolor{blue}{通过计算经验分布函数与理想累积分布函数} 通过计算经验分布函数与理想累积分布函数之间的最大差异来进行检验
直接利用样本的均值和方差进行计算
最适用于 对称分布的小样本 \textbf{\textcolor{pink}{对称分布的小样本}} 对称分布的小样本,也适用于大样本
⋅ \cdot 只适用于正态性检验。

③Anderson–Darling test (AD)
通过计算数据的 累积分布曲线与理想正态分布的累积分布 \textcolor{blue}{累积分布曲线与理想正态分布的累积分布} 累积分布曲线与理想正态分布的累积分布曲线之间的差异来进行检验,且考虑了两条累积分布曲线之间的 所有差异 \textcolor{red}{所有差异} 所有差异(比K-S检验效果更好)
仅适用于小样本,推荐<26。但有些超过200的工业数据也有可能通过A-D检验。
⋅ \cdot 可用于检验其他分布。

(2)基于卡方分布(Chi-squared distribution)
①D’Agostino’s K-squared test (Skewness-Kurtosis test)
通过计算偏度(Skewness)和峰度(Kurtosis)来量化数据分布曲线与标准正态分布曲线之间的差异与不对称性,
适用于大样本
⋅ \cdot 仅能用于正态性检验。

②Jarque–Bera test
必须用于大样本(matlab提到样本量小于2000时,显著性水平会从0.001跌到0.5),
⋅ \cdot 只能用于正态性检验。

(3)基于回归和相关(regression- and correlation-based)
①Shapiro–Wilk test(SW)
最有效 在每一个样本值都是唯一时的检验效果最好,但若样本中存在几个值重复的情况下该方法便会大打折扣。因此该方法只适用于小样本,推荐样本量为7~2000。当样本量超过5000时不再适用

matlab函数源下载
swtest()函数使用:When the series ‘X’ is Leptokurtic, SWTEST performs the Shapiro-Francia test, else (series ‘X’ is Platykurtic) SWTEST performs the
Shapiro-Wilk test.

峰度分类
峰度def:是一种统计量,用于衡量分布包含异常值的程度。峰度是分布形状的无单位度量。
峰度分为三种:尖峰、平峰和中峰。kurtosis: leptokurtic, platykurtic, and mesokurtic.
尖峰分布为具有比正态分布更高的峰度。这些分布具有“重尾”,表明它们具有相对较长的尾部,包含更多异常值。相反,平峰分布具有更短且包含更少极值的“轻尾”。
都使用正态分布作为比较的基础。 减去3,正过量值表示重尾,而负值表示轻尾。

∙ \bullet Leptokurtic distributions – High Kurtosis
T-distributions低自由度为尖峰分布,但随着DF增加收敛于正态分布。
Laplace distributions also have higher kurtosis than normal distributions. This distribution is symmetrical, but its tails approach zero more slowly.

蓝线-normal 红虚线-尖峰分布
∙ \bullet Platykurtic distributions – Low Kurtosis
The uniform distribution is an extreme example of a platykurtic distribution because it does not produce outliers.
The beta distribution can also have low values.
在这里插入图片描述

常用选择方法:
(1)当样本量较大时通常会选择 K-S-L test 或 D’Agostino’s K-squared test
(2)当样本量较小时通常选用 AD test 或 SW test

在这里插入图片描述

经验:

  1. 在实际操作中可以根据样本量大小选择多种检验方法进行正态性检验,同时通过QQ图等图示法辅助判断;

参考:
正态性检验总结 特别特别地好
Mathworks 假设检验命令lists 全

假设检验的理论

偏度与峰度 检测正态性

  • 25
    点赞
  • 20
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
毕业设计,基于SpringBoot+Vue+MySQL开发的公寓报修管理系统,源码+数据库+毕业论文+视频演示 现代经济快节奏发展以及不断完善升级的信息化技术,让传统数据信息的管理升级为软件存储,归纳,集中处理数据信息的管理方式。本公寓报修管理系统就是在这样的大环境下诞生,其可以帮助管理者在短时间内处理完毕庞大的数据信息,使用这种软件工具可以帮助管理人员提高事务处理效率,达到事半功倍的效果。此公寓报修管理系统利用当下成熟完善的Spring Boot框架,使用跨平台的可开发大型商业网站的Java语言,以及最受欢迎的RDBMS应用软件之一的MySQL数据库进行程序开发。公寓报修管理系统有管理员,住户,维修人员。管理员可以管理住户信息和维修人员信息,可以审核维修人员的请假信息,住户可以申请维修,可以对维修结果评价,维修人员负责住户提交的维修信息,也可以请假。公寓报修管理系统的开发根据操作人员需要设计的界面简洁美观,在功能模块布局上跟同类型网站保持一致,程序在实现基本要求功能时,也为数据信息面临的安全问题提供了一些实用的解决方案。可以说该程序在帮助管理者高效率地处理工作事务的同时,也实现了数据信息的整体化,规范化与自动化。 关键词:公寓报修管理系统;Spring Boot框架;MySQL;自动化;VUE
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值