上一篇讲了正态分布的基本概念和概率求解的计算方法(正态分布及其概率计算https://blog.csdn.net/weixin_41140174/article/details/99696028),这篇主要讲独立正态分布组合概率的计算、二项分布近似正态分布的条件和运用,泊松分布近似正态分布的条件和运用
1. 独立正态分布组合概率计算
问题:已经新郎和新娘的体重都符合正态分布,分别为新郎~N(190,500), 新娘~N(150,400),过山车座驾最高能够承载380磅的重量,为安全起见,新郎新娘综合体重不能超过380磅,问新郎新娘综合体重不超过这个数值的概率是多少?
如果独立的随机变量X和Y都符合正态分布,那么X+Y也符合正态分布,如果:
如果独立的随机变量X和Y都符合正态分布,那么X-Y也符合正态分布,如果:
问题求解:上述问题就转化为求X+Y的分布概率问题,即X+Y~N(340,900)分布,求P(X+Y<380),是简单的正态分布概率计算。
如果变量X符合正态分布,记为X~N(μ,σ^2), 则aX+b也符合正态分布,记为:
如果变量X符合正态分布,记为X~N(μ,σ^2),则X1+X2+...+Xn也符合正态分布
问题:有40个选择题,每个选择题有4个答案,答对30题则可以进入下一轮并获得不菲奖金,如果随机作答,问通过的概率有多少?
这是一个二项分布问题,X~B(40,0.25), 要求P(X>=30), 相当于求P(X=30)+P(X=31)+...+P(X=40)
由于涉及到大的阶乘计算,且要计算的概率事件比较多,因此计算量非常大,容易出错。
如果X~B(n,p), 且np>5, np>5 (也有的统计书上的要求是np、nq>10), 则可以近似有X~N(np,npq)近似替代二项分布(np, npq分别是二项分布的期望和方差)。
注:James .T.McClave《商务与经济统计学》的二项分布可近似为整体分布的条件为(μ-3σ,μ-3σ)(其中μ=np,σ=npq^1/2)落在二项分布(0,n)之内
上述问题P(X>=30)就转化为X~N(np,npq)中的P(X>=30)的问题,通过转化为标准正态分布并查询概率分布表,可以轻松获得结果。但运用的时候需要对X进行连续性修正。
主要是对于变量X的范围边界处理,对于离散分布,X=30是一个确定的概率,但在连续分布,概率分布总是一定范围内的概率,X=30的概率分布为0,离散X=30是对应到连续变量的范围应为29.5-30.5。
于是,P(X>=30)(离散分布)--->P(X>29.5)(正态分布),这种调整称为连续性修正,在n比较小的时候非常重要。
- 求离散分布P(X<=a), 相当于求正态分布P(X<a+0.5)
- 求离散分布P(X>=a), 相当于求正态分布P(X>a-0.5)
- 求离散分布P(a<=X<=b), 相当于求正态分布P(a-0.5<X<b+0.5)
问题:已经过山车每年发生故障的次数为40,问故障低于52次的概率是多少?
这是一个泊松分布问题,需要求出故障次数从1次到51次的概率之和,然后相加,非常大的计算量。既然求一个范围内的概率,那我们可以用连续分布来近似。
如果X~P0(λ)且λ>15, 则可以用X~N(λ,λ)进行近似,其中λ为泊松分布的期望和方差。