案例数据雇员数据employee,公众号后台回复【雇员】下载数据,尝试对当前薪金数据做正态分布检验。
图形法辅助观察正态分布利用ggpubr包ggqqplot()绘制QQ图,辅助观察一组数据的正态性。
解读:多数点偏离直线,所以认为当前薪金数据为非正态分布数据。
统计检验正态性利用shapiro.test()函数对小样本数据(3~5000)做正态分布检验。原假设数据服从正态分布,当伴随概率P值大于0.05时,认为数据服从正态分布。
![e5ae984db5ec90c68bd878c18f101089.png](https://img-blog.csdnimg.cn/img_convert/e5ae984db5ec90c68bd878c18f101089.png)
ggqqplot(employee,x = "salary")
![bc9718aa9a9fd2949b0b6f238c425e7c.png](https://img-blog.csdnimg.cn/img_convert/bc9718aa9a9fd2949b0b6f238c425e7c.png)
shapiro.test(employee$salary)
Shapiro-Wilk normality testdata: employee$salaryW = 0.77061, p-value < 2.2e-16解读:当前薪金数不服从正态分布(W=0.771,P<0.001)