正态分布在概率论和数理统计中扮演着重要的角色。这个分布是由Carl Friedrich Causs在测量误差模型时提出的,又称为高斯分布。正态分布可以描述很多不同的现象,例如,人的身高、IQ得分的分布、气体分子的速度。正态分布的密度函数依赖于两个参数,u和σ。(其中-∞<u<∞,σ>0)
我们将“X服从参数为u和σ的正态分布”简记为X~N(u,σ2)。
图形
正态分布的密度函数图形依赖于u和σ两个参数。其中均值u的大小决定了函数的极大值的偏移,那个最高点的位置,例如,u=2,那么密度函数的最高点就在x=2处。σ决定了函数的最高值的大小(分布的分散程度),当σ值越小的时候,密度函数的最高点就越大(分布越集中);相反的,当σ值越大的时候,密度函数的最高点就越小(分布越分散)。
标准正态分布
命题:如果X~N(u,σ2),Y=aX+b,那么Y ~(au+b,a2σ2)。
由正态分布计算概率时,这个命题十分有用。
假设X~N(u,σ2),对某些数值x0和x1我们希望得到P(x0<X<x1)。
考虑随机变量Z=(X-u)/σ,可以取a=1/σ,b=-u/σ,利用命题我们可以的得到Z~N(0,1),即Z服从标准正态分布。
因此P(x0<X<x1)=Fx(x1)-Fx(x0) = Φ((x1-u)/σ) - Φ((x0-u)/σ)
因此,一般正态随机变量的概率可以由标准正态随机变量的概率得到。这是非常有用的,我们只需要制作标准正态分布表,而不需要对任意的u和Φσ分别制作。
二元正态密度
二元正态密度最早的使用是用来建立父亲和儿子身高的联合分布模型。密度依赖于五个参数:-∞<ux<∞,σx>0,-∞<uy<∞,σy>0,-1<ρ<1。
二元正态密度的边际密度fx,fy都是标准正态分布。
边际密度不能决定联合密度。
如果ρ=0,椭圆的轴平行于xoy平面,如果ρ≠0,他们是倾斜的。