二项分布近似正态分布

# JFZero

已于 2023-06-15 17:31:20 修改

阅读量1.1w

点赞数 5

分类专栏：统计学习文章标签：机器学习 python 概率论

于 2023-05-11 19:53:42 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_50348308/article/details/130628889

版权

统计学习专栏收录该内容

17 篇文章

订阅专栏

文章详细阐述了伯努利分布与二项分布的关系，以及当样本数量足够大时，如何通过中心极限定理将二项分布近似为正态分布。它解释了样本值之和X服从正态分布的条件，同时讨论了样本均值的期望和方差，以及它们在显著性检验中的应用。此外，还强调了样本方差和样本均值方差在统计分析中的不同角色。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

中心极限定理下的二项分布近似正态分布

伯努利分布

伯努利分布 0-1分布：X~（0，1）分布，即X值为0，或是X值为1，概率为P

单个样本服从（0，1）分布时：

期望 E（X) =P*1 + (1-P)*0 = P

方差VAR(X) = E( [X-E(X)]² ) = E(X²）-E²(X) = P-P²

伯努利分布→二项分布

n个独立样本，每个样本x1,x2,…xn都服从(0,1)分布时，伯努利分布就会变为二项分布：
（二项分布，其实就是n次伯努利分布）

样本期望E（X)=E（x1+x2+x3+…xn)=nP
样本方差Var(X)=Var(x1+x2+…xn)=Var(x1)+Var(x2)+…Var(xn)=n(P-P²)

样本均值的期望E( $X^-$ ) = E( $\frac{x1+x2+x3+....xn}{n}$ ) = P
样本均值的方差Var( $X^-$ ) = Var( $\frac{x1+x2+x3+....xn}{n}$ ) = Var( $\frac{x1}{n}$ ) +Var( $\frac{x2}{n}$ ) + +…Var( $\frac{xn}{n}$ ) = $\frac{P-P²}{n}$

二项分布→正态分布

① 当n足够大，二项分布中的样本值之和 X 服从正态分布N（nP，n(P-P²））

样本值 X 表示在n个样本中，有 X 个样本值为1，即 X = nP

其中，样本值X表示每个样本值之和，之所以会服从正态分布，底层原因是由于中心极限定理
——实验：总体进行m次抽样，每次抽样样本容量为n，那么抽样次数m足够大，那么每次样本值之和都会近似为nP

例如，进行500次检验，每次检验抽查100个人的核酸结果，其中阳性概率为10%，那么每次检验时，阳性人数一般会较为相近，大约在10人上下浮动，这500次检验的阳性人数就会接近正态分布。

👇
其中，阳性人数就是每次检验的均值，均值服从正态分布。

② 当n足够大，根据中心极限定理，样本均值 P 服从正态分布（P， $\frac{P-P²}{n}$ ）

其中，在二项分布中的样本均值，也表示样本比例，即 P = X / n

所以可知，在样本量n较大时，根据中心极限定理，样本比例(即样本均值）服从正态分布（P， $\frac{P-P²}{n}$ ）。

样本方差和样本均值方差是有差异的！

样本方差：用于衡量样本里，每一个样本之间的离散程度。样本方差的开方，叫做标准差。
👉进行显著性检验时要注意：让样本方差➗样本量，才能变为样本均值服从正态分布下的显著性检验。

① 当n足够大，二项分布中的样本值之和 X 服从正态分布N（nP，n(P-P²））
则检验统计量 Z = $\frac{np-σ}{n}$

样本均值方差：用于衡量总体里，每个样本均值之间的离散程度。样本均值的方差，开方后叫做标准误。
👉进行显著性检验时要注意：无需让样本均值方差➗样本量，因为本身就是样本均值服从正态分布下的显著性检验。

② 当n足够大，根据中心极限定理，样本均值 P 服从正态分布（P， $\frac{P-P²}{n}$ ）
则检验统计量 Z = $p - σ$

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。