python 一组数据 正态分布散点图_如何在SPSS、Python、R中用Q-Q图检验数据是否服从正态分布?...

24432550fed8cbb3b3c242ddc6124c97.png

正态分布广泛存在于自然现象、生产、生活的方方面面,例如试卷命题难度,产品的使用寿命、农作物产量、气温、降水量、工资收入、人类的身高体重肺活量,甚至颜值……

关于正态分布的数学定义及各种性质,不在此赘述。简单理解,就是“两头小,中间大”,比如长相奇丑无比和倾国倾城的人都是少数,绝大多数人都属于大众脸。

很多时候,在进行数据分析工作时,首先要看的就是数据是服从何种概率分布,而正态分布则是最重要的一种概率分布,而且有一些数据分析方法的前提是要求数据整体服从正态分布,所以有必要了解如何检验数据是否服从正态分布。

有很多方法可以进行正态性检验,比如计算数据分布的偏度系数、峰度系数,再进行U检验;或者进行非参数检验,包括Kolmogorov-Smirnov检验(D检验)和Shapiro- Wilk (W 检验);还有最直观的图示法,包括Q-Q图、P-P图、直方图。

强烈推荐使用Q-Q图,简单直观。Q-Q图是一个散点图,以样本的分位数作为横坐标,以按照正态分布计算的相应分位点作为纵坐标。如果数据服从正态分布,则数据样本点近似的围绕在对角线附近。

一、SPSS软件

8b1331273fa84e9e336b3e2f979cfa69.png
依次选择【分析——描述统计——Q-Q图】

59a60996382a826fb3c93c8edcea8815.png
将要检验的变量移动到右侧变量选框,并确保检测分布是【正态】,然后点击确定

6e8ca71d8604ce019f32fbced775080a.png
搞定!

二、Python语言

在Python中有很多强大的科学计算库,可以方便的绘制Q-Q图。

#导入依赖库

ccabd51b804f93954895131e6b1e40fc.png
散点近似的分布在对角线上,基本可以判断为服从正态分布

三、R语言

R语言绘制Q-Q图也很方便,就是默认格式的图有点丑,看个人习惯吧。

#加载依赖库
library(qqman)

#加载本地数据
data <- read_excel("normal.xlsx", sheet = "Sheet1")

#绘制Q-Q图
qqnorm(data$变量, main="Q-Q plot: 变量")

#添加对角线
qqline(data$变量)

#绘制Q-Q图
qqnorm(log(data$变量), main="Q-Q plot: log(变量)")

3eefd6167a13d2942d4abd6426fcf6af.png

060f9784146a8efb8cf321163ba4455d.png

e656e629a47ee7da215f25f7d0ba22d3.png

17a56a64285eafc0ed5e7394a4641cca.png

不管是用哪种方法,本质都是一样的,没有最优的,只有最合适的,结合自己使用时的数据处理流程选用就好。

  • 1
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值