正态分布定义解释及案例介绍

正态分布,也称常态分布,是描述中间密集、两边稀疏现象的关键统计概念。它在身高、体重等众多领域都有广泛应用。理解和掌握正态分布,包括其概率密度函数、均值和标准差,对于统计学中的区间概率计算和假设检验至关重要。通过标准化,可以将任何正态分布转换为标准正态分布,便于查表求概率。
摘要由CSDN通过智能技术生成

正态分布,这个我们从中学就学过的内容,真有这么重要吗?

真正学懂统计的人对这一点是不会质疑的,彻底弄懂正态分布是灵活运用统计学中各种假设检验方法、看懂p值,理解均数置信区间的前提。

1. 从名字说起
为什么叫“正态分布”,也有地方叫“常态分布”,这两个名字都不太直观,但如果我们各取一字变为“正常分布”,就很白话了,而这正是“正态分布”的本质含义,Normal Distribution。

它太常见了,基本上能描述所有常见的事物和现象:正常人群的身高、体重、考试成绩、家庭收入等等。这里的描述是什么意思呢?就是说这些指标背后的数据都会呈现一种中间密集、两边稀疏的特征。以身高为例,服从正态分布意味着大部分人的身高都会在人群的平均身高上下波动,特别矮和特别高的都比较少见。

你可能不禁要问,这是为什么?因为我们研究的对象具有同质性(比如都是成年的中国男子),所以其特征往往是趋同的,即存在一个基准;但由于个体变异的存在(当然变异不会太大),这些特征又不是完全一致,所以会以一定的幅度在基准的上下波动,从而形成了中间密集,两侧稀疏的特征。

2. 连续型随机变量研究区间概率
了解了正态分布的基本思想,我们来看看实际应用中我们需要掌握的要点。

首先,正态分布属于“连续型随机变量分布”的一类。我们知道,对于连续型随机变量,我们不关注“点概率”,只关注 “区间概率” ,这是什么意思?

我们看这个例子:假定随机变量 X 指是“北京市成年男子的身高”,理论上它可以取任意正数,所以我们把它当做一个连续型随机变量(连续型变量,就是指可以取某一区间或整个实数轴上的任意一个值的变量)来看待。

这里,我们先想一想如何计算P(X =1.87)? 即身高恰好完全exactly等于1.87的概率是多少,这就是所谓的“点概率”。

更极端一点,让随机变量Y是 [0,1] 这个区间上的任意一点ÿ

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值