一、如何判断一个资料是否为正态分布。
最常用的是让SPSS做出频数分布图,这样比较直观,但不够精确。一个比较简单有效的方法是让SPSS做出描述性统计分析(Descriptive
Statistics),在Distribution(分布分析)这个选项卡中将Skewness(偏度系数)和Kurtosis(峰度系数)两个选项前的方框打上小钩,这样就可以得出偏度系数和峰度系数及其标准误。然后将所得的偏度系数和峰度系数除以其标准误,就可以得出资料在偏度和峰度上按u分布(若为小样本,则为t分布)的检验值,所得到的值若<1.96(P>0.05),则数据在该方向上为正态分布;反之,所得到的值若>1.96(P<0.05)或>2.58(P<0.01),则资料在该方向上为偏态分布。即如果资料为正态分布时,Skewness与Kurtosis的值都应等于零,若Skewness值为正时,曲线左偏,Skewness值为负时,曲线右偏。而Kurtosis值为正时,曲线较平坦,Kurtosis值为负时,曲线峰度超出正态分布,即靠中心处的数据过多(当然,这在频数图上一目了然,但频数图不能证明正态性,而偏度和峰度检验则可做到这一点)
二、对于不服从正态分布资料的描述:
1. 若是经对数变换后,可转换成正态分布的资料,可使用几何均数和对数标准差描述。2.
未经变换的资料可使用中位数描述其集中趋势,用四分位数间距描述其离散程度。
三、Excel,Matlab求四分位数
先说Excel:
MEDIAN(array)中位数
QUARTILE(array,quart)