正态分布的动机源于中心极限定理(我们后面会介绍这个定理),这个定理说明正态分布为应用于统计推断提供了重要的一族分布,我们首先从标准正态分布开始。
考虑积分
这个积分是存在的,因为积分项是正的连续函数,它小于一个积分函数即
且
为了计算
I
,注意到
通过极坐标变换可以求出该积分。如果令
z=rcosθ,w=rsinθ
,那么我们有
因为
(1)
在
R
上是正的且
对于
t∈R
,
Z
的mgf推导如下:
其中对于最后一步积分,我们进行了一对一的变量代换
w=z−t
,根据
(2)
可知,表达式
(3)
的值为1,因此
Z
的mgf为:
MZ(t)
的前二阶导如下:
将
t=0
代入得到
Z
的均值与方差为
接下来定义连续随机变量
X
为
其中
b>0
,这是一对一变换,为了求出
X
的pdf,注意到变换的逆与雅可比为:
由
(5)
可得出
E(X)=a,var(X)=b2
,因此在
X
的pdf表达式中,我们可以用
定义1:
对于随机变量
X
,如果它的pdf为
参数
μ,σ2
分别是
X
的均值与方差,我们常写成
利用上面的符号,
(2)
中的随机变量
Z
满足
对于
其中 −∞<t<∞ 。
总结一下就是:
例1:
如果
X
的mgf为
那么
X
满足
例2:
之前我们用标准正态随机变量的矩生成函数推导出它的各阶矩,现在利用这个结论推导出满足
N(0,1)
分布的随机变量
X
的各阶矩。同上面一样,我们可以写成
之前给出了
Z
的奇数矩为0,偶数矩由确定的表达式,将其代入
正态pdf
文章开头提到,许多实际应用设计到正态分布,特别的,我们很想计算与其有关的概率。然而正态分布的pdf包含
exp−s2
这些项,因此无法以封闭的形式得到它们的反导,必须使用数值积分方法。因为标准正态分布与正态分布之间的关系
(8)
,我们只需要计算标准正态分布的概率即可,为此我们将标准正态随机变量
Z
的cdf表示为
令
X
满足
因此我们只需要
Φ(z)
的数值积分值,正态值通过
Z
的值就能计算出来了。例如,对于特定的
图1
图
2
为标准正态密度,从左到
例3:
令
X
满足
且
图2
例4:
假设
X
满足
例5:
假设某正态分布
N(μ,σ2)
小于60的概率为百分之十,大于90的概率为百分之五,那么
μ,σ
的值是多少?给定随机变量
X
满足
由此可得 μ=73.1,σ=10.2 。
注1: 之后我们会常遇到与分布相关的三个参数, N(μ,σ2) 中的均值 μ 称为位置参数,因为改变这个值只是简单的改变了正态pdf中间的位置;即pdf的图像与原来是一样的,除了位置移动了以外。 N(μ,σ2) 的标准差 σ 称为尺度参数,因为小的 σ 需要正态pdf又高又窄,而大的 σ 需要正态pdf又低又宽,然而不论 μ,σ 是什么值,正态pdf的图像都与钟类似,顺带提一下,伽玛分布的参数 β 也称为尺度参数, α 称为形状参数,因为改变值后其形状发生了变化。二项与泊松分布的 p,μ 也都是形状参数。
最后介绍两个重要的定理。
定理1:
如果随机变量
X
满足
证明:
因为
V=W2
,其中
W=(X−μ)/σ
满足
N(0,1)
,所以对
v≥0
,
G(v)
的cdf为
即
且
进行变量代换
w=y√
,那么
因此连续型随机变量
V
的pdf
因为
Γ(12)=π‾‾√
,所以
V
为
另一个重要的定理就是独立情况下的加性。
定理2:
令
X1,…,Xn
是独立的随机变量,使得
Xi
满足
N(μi,σ2i)
分布。令
Y=Σni=1aiXi
,其中
a1,…,an
是常数,那么
Y
的分布为
证明:
利用独立性与正态分布的mgf,对于
t∈R
,
Y
的mgf为
这就是 N(Σni=1aiμi,Σni=1a2iσ2i) 分布的mgf。 ||
该结论一个简单的推论为 X¯=n−1Σni=1Xi 的分布,其中 X1,X2,…,Xn 为独立同分布的随机变量。
推论1: 令 X1,…,Xn 是独立同分布 N(μ,σ2) 的随机变量,令 X¯=n−1Σni=1Xi ,那么 X¯ 满足 N(μ,σ2/n) 分布。
为了证明这个推论,只需要取 ai=(1/n),μi=μ,σ2i=σ2 ,其中 i=1,2,…,n ,然后利用定理2即可。