一、随机变量
1.1 概率
随机事件
A
A
A发生的可能性度量,称为
A
A
A发生的概率,记为
P
(
A
)
P(A)
P(A)。
随机试验的每一个可能结果称为样本点,全部样本点的集合称为样本空间。在重复实验中,若满足样本点有限,且每个单位事件发生的可能性均相等,则称该实验的概率模型为古典概型;若样本点是连续可度量的有界区域,且每个单位事件发生的可能性均相等,则称该实验的概率模型为几何概型。
若事件
A
A
A与
B
B
B之间任意一个事件发生的概率不受另一个事件的影响,则称两事件相互独立。
1.2 一维离散型随机变量
设
X
X
X是随机变量,
x
x
x是任意实数,则称
F
(
x
)
=
P
{
X
≤
x
}
F(x) = P\{X \le x\}
F(x)=P{X≤x}为
x
x
x的分布函数。
若随机变量
X
X
X只取有限个值,则称
X
X
X为离散型随机变量。称
p
{
X
=
x
i
}
=
p
i
p\{X = x_i\} = p_i
p{X=xi}=pi为
X
X
X的概率分布,记为
X
∼
(
X
1
.
.
.
X
n
p
1
.
.
.
p
n
)
X \sim \left( \begin{matrix}X_1 & ... & X_n \\ p_1 & ... & p_n \end{matrix} \right )
X∼(X1p1......Xnpn)
若
X
X
X仅取
{
0
,
1
}
\{0, 1\}
{0,1}且
p
{
X
=
1
}
=
p
p\{X = 1\} = p
p{X=1}=p,则称
X
X
X服从于参数为
p
p
p的0-1分布,记
x
∼
B
(
1
,
p
)
x \sim B(1, p)
x∼B(1,p)。
若 X X X是n重伯努利实验,即在同样的条件下重复地、相互独立地进行的一种随机试验中事件发生的次数,且在每一次实验中事件发生的概率为 p p p,则称 X X X服从于参数为 ( n , p ) (n ,p) (n,p)的二项分布,记 X ∼ B ( n , p ) X \sim B(n, p) X∼B(n,p)。
若 X X X是伯努利试验中事件首次发生所需要的试验次数,且在每一次实验中事件发生的概率为 p p p,则称 X X X服从于参数为 p p p的几何分布,记 X ∼ G ( p ) X \sim G(p) X∼G(p)。
若
X
X
X表示某情况下单位时间中事件发生的频数,平均频数为
λ
\lambda
λ,那么
X
X
X服从于参数为
λ
\lambda
λ的泊松分布,记为
X
∼
P
(
λ
)
X \sim P(\lambda)
X∼P(λ),其概率分布为
p
{
X
=
k
}
=
λ
k
/
k
!
⋅
e
x
p
{
−
λ
}
p\{X = k\} = \lambda^k/k!·exp\{-\lambda\}
p{X=k}=λk/k!⋅exp{−λ}
若
X
X
X表示在
N
N
N个总样本中存在
M
M
M个正样本,则在取出
n
n
n个样本中正样本的个数,则称
X
X
X服从于参数为
(
n
,
N
,
M
)
(n, N, M)
(n,N,M)的超几何分布,记
X
∼
H
(
n
,
N
,
M
)
X \sim H(n, N, M)
X∼H(n,N,M)。
1.3 一维连续型随机变量
设
X
X
X是随机变量,
x
x
x是任意实数,
F
(
x
)
=
P
{
X
≤
x
}
F(x) = P\{X \le x\}
F(x)=P{X≤x}为
x
x
x的分布函数,其可以表示为
F
(
x
)
=
∫
−
∞
x
f
(
t
)
d
t
F(x) = \int_{-\infty}^xf(t)dt
F(x)=∫−∞xf(t)dt那么,称
X
X
X是连续型随机变量,将
f
(
x
)
f(x)
f(x)称为
X
X
X的概率密度函数。
考虑
Y
=
g
(
X
)
Y = g(X)
Y=g(X),
X
X
X的概率密度为
f
X
(
x
)
f_X(x)
fX(x),那么
Y
Y
Y的概率密度为
f
Y
(
y
)
=
F
Y
(
y
)
′
=
d
(
P
{
Y
≤
y
}
)
/
d
y
=
d
(
P
{
g
(
X
)
≤
y
}
)
/
d
y
=
d
(
∫
g
(
x
)
≤
y
f
X
(
x
)
d
x
)
/
d
y
\begin{aligned}f_Y(y) &= F_Y(y)' \\&= d(P\{Y \le y\})/dy \\&= d(P\{g(X) \le y\})/dy \\&= d(\int_{g(x) \le y}f_X(x)dx)/dy \end{aligned}
fY(y)=FY(y)′=d(P{Y≤y})/dy=d(P{g(X)≤y})/dy=d(∫g(x)≤yfX(x)dx)/dy
若 X X X的概率密度为 f ( x ) = { 1 / ( b − a ) , a < x < b 0 , o t h e r w i s e f(x) = \left\{\begin{aligned} &1/(b - a), &&a < x < b \\ &0, &&otherwise \\\end{aligned}\right. f(x)={1/(b−a),0,a<x<botherwise则称 X X X在区间 ( a , b ) (a, b) (a,b)上服从均匀分布,记为 X ∼ U ( a , b ) X \sim U(a, b) X∼U(a,b)。
若 X X X的概率密度为 f ( x ) = { λ e x p { − λ x } , x > 0 0 , o t h e r w i s e f(x) = \left\{\begin{aligned} &\lambda exp\{-\lambda x\}, &&x > 0 \\ &0, &&otherwise \\\end{aligned}\right. f(x)={λexp{−λx},0,x>0otherwise则称 X X X服从于参数为 λ \lambda λ的指数分布,记为 X ∼ E ( λ ) X \sim E(\lambda) X∼E(λ)。
若 X X X的概率密度为 f ( x ) = 1 / ( ( 2 π ) 1 / 2 σ ) ⋅ e x p { − ( x − μ ) 2 / 2 σ 2 } f(x) = 1/((2\pi)^{1/2}\sigma)·exp\{-(x - \mu)^2/2\sigma^2\} f(x)=1/((2π)1/2σ)⋅exp{−(x−μ)2/2σ2}则称 x x x服从于参数为 ( μ , σ 2 ) (\mu, \sigma^2) (μ,σ2)的正态分布,记为 X ∼ N ( μ , σ 2 ) X \sim N(\mu, \sigma^2) X∼N(μ,σ2)。当 μ = 0 \mu = 0 μ=0, σ = 1 \sigma = 1 σ=1时,正态分布 N ( 0 , 1 ) N(0, 1) N(0,1)称为标准正态分布,其概率密度记为 ϕ ( x ) = 1 / ( 2 π ) 1 / 2 ⋅ e x p { − x 2 / 2 } \phi(x) = 1/(2\pi)^{1/2}·exp\{-x^2/2\} ϕ(x)=1/(2π)1/2⋅exp{−x2/2}及其分布函数 Φ ( x ) = 1 / ( 2 π ) 1 / 2 ∫ − ∞ x e x p { − t 2 / 2 } d t \Phi(x) = 1/(2\pi)^{1/2}\int_{-\infty}^xexp\{-t^2/2\}dt Φ(x)=1/(2π)1/2∫−∞xexp{−t2/2}dt
1.4 联合分布与边缘分布函数
如果
X
1
,
.
.
.
,
X
n
X_1, ..., X_n
X1,...,Xn是定义在同一个样本空间的n个随机变量,则称
(
X
1
,
.
.
.
,
X
n
)
(X_1, ..., X_n)
(X1,...,Xn)为n维随机变量。当n取2时,记
(
X
,
Y
)
(X, Y)
(X,Y)是二维随机变量。
对于任意实数
x
x
x与
y
y
y,称二元函数
F
(
x
,
y
)
=
P
{
X
≤
x
,
Y
≤
y
}
F(x, y) = P\{X \le x, Y \le y\}
F(x,y)=P{X≤x,Y≤y}为二维随机变量
(
X
,
Y
)
(X, Y)
(X,Y)的联合分布函数,记
(
X
,
Y
)
∼
F
(
x
,
y
)
(X, Y) \sim F(x, y)
(X,Y)∼F(x,y);而随机变量
X
X
X的分布函数
F
X
(
x
)
F_{X}(x)
FX(x)则称为
(
X
,
Y
)
(X, Y)
(X,Y)关于
X
X
X的边缘分布函数,且有
F
X
(
x
)
=
P
{
X
≤
x
}
=
F
(
x
,
+
∞
)
F_X(x) = P\{X \le x\} = F(x, +\infty)
FX(x)=P{X≤x}=F(x,+∞)
1.5 二维离散型随机变量
若随机变量
(
X
,
Y
)
(X, Y)
(X,Y)只能取有限对值,则称
(
X
,
Y
)
(X, Y)
(X,Y)为二维离散型随机变量,称
p
{
X
=
x
i
,
Y
=
y
j
}
=
p
i
j
p\{X = x_i, Y = y_j\} = p_{ij}
p{X=xi,Y=yj}=pij为
(
X
,
Y
)
(X , Y)
(X,Y)的联合概率分布。
随机变量
(
X
,
Y
)
(X, Y)
(X,Y)的联合分布函数为
F
(
x
,
y
)
=
P
{
X
≤
x
,
Y
≤
y
}
=
∑
x
i
≤
x
∑
y
j
≤
y
p
i
j
\begin{aligned}F(x, y) & = P\{X \le x, Y \le y\} \\ & = \sum_{x_i\le x}\sum_{y_j \le y}p_{ij} \end{aligned}
F(x,y)=P{X≤x,Y≤y}=xi≤x∑yj≤y∑pij
X
X
X的边缘分布函数为
P
{
X
=
x
i
}
=
∑
j
=
1
m
P
{
X
=
x
i
,
Y
=
y
j
}
P\{X = x_i\} = \sum_{j=1}^{m}P\{X = x_i, Y = y_j\}
P{X=xi}=j=1∑mP{X=xi,Y=yj}
1.6 二维连续型随机变量
若随机变量
(
X
,
Y
)
(X, Y)
(X,Y)的联合分布函数
F
(
x
,
y
)
F(x, y)
F(x,y)可以表示为
F
(
x
,
y
)
=
∫
−
∞
x
∫
−
∞
y
f
(
u
,
v
)
d
u
d
v
F(x, y) = \int_{-\infty}^x\int_{-\infty}^yf(u, v)dudv
F(x,y)=∫−∞x∫−∞yf(u,v)dudv则称
(
X
,
Y
)
(X, Y)
(X,Y)为二维连续型随机变量,称
f
(
u
,
v
)
f(u, v)
f(u,v)是
(
X
,
Y
)
(X, Y)
(X,Y)的联合概率密度。若
F
(
x
,
y
)
F(x, y)
F(x,y)连续,则有
∂
2
F
(
x
,
y
)
/
∂
x
∂
y
=
f
(
x
,
y
)
∂^2F(x, y)/∂x∂y = f(x, y)
∂2F(x,y)/∂x∂y=f(x,y)
1.7 卷积公式
设二维连续型随机变量
(
X
,
Y
)
∼
f
(
x
,
y
)
(X, Y) \sim f(x, y)
(X,Y)∼f(x,y),考虑
Z
=
X
+
Y
Z = X + Y
Z=X+Y的概率密度为
F
Z
(
z
)
=
P
{
Z
≤
z
}
F_Z(z) = P\{Z \le z\}
FZ(z)=P{Z≤z},即
F
Z
(
z
)
=
P
{
X
+
Y
≤
z
}
=
∬
x
+
y
≤
z
f
(
x
,
y
)
d
σ
=
∫
R
d
y
∫
−
∞
z
−
y
f
(
x
,
y
)
d
x
\begin{aligned}F_Z(z) & = P\{X + Y \le z\} \\ & = \iint_{x + y \le z}f(x, y)d\sigma \\& = \int_R dy\int_{-\infty}^{z-y}f(x, y)dx \end{aligned}
FZ(z)=P{X+Y≤z}=∬x+y≤zf(x,y)dσ=∫Rdy∫−∞z−yf(x,y)dx那么
f
Z
(
z
)
=
d
F
Z
(
z
)
/
d
z
=
d
(
∫
R
d
y
∫
−
∞
z
−
y
f
(
x
,
y
)
d
x
)
/
d
z
=
∫
R
d
y
⋅
d
(
∫
−
∞
z
−
y
f
(
x
,
y
)
d
x
)
/
d
z
=
∫
R
f
(
z
−
y
,
y
)
d
y
\begin{aligned}f_Z(z) & = dF_Z(z)/dz \\ & = d(\int_R dy\int_{-\infty}^{z-y}f(x, y)dx)/dz \\& = \int_R dy·d(\int_{-\infty}^{z-y}f(x, y)dx)/dz \\& = \int_R f(z - y, y)dy \end{aligned}
fZ(z)=dFZ(z)/dz=d(∫Rdy∫−∞z−yf(x,y)dx)/dz=∫Rdy⋅d(∫−∞z−yf(x,y)dx)/dz=∫Rf(z−y,y)dy若
X
X
X与
Y
Y
Y相互独立,则有
f
Z
(
z
)
=
∫
R
f
X
(
x
)
f
Y
(
z
−
x
)
d
x
f_Z(z) = \int_Rf_X(x)f_Y(z-x)dx
fZ(z)=∫RfX(x)fY(z−x)dx称为卷积公式。
1.8 随机变量的数字特征
数学期望反映了随机变量平均取值的大小,当
X
X
X离散或连续时分别记为
E
X
=
∑
i
=
1
n
x
i
p
i
E
X
=
∫
R
x
f
(
x
)
d
x
EX = \sum_{i=1}^nx_ip_i \\ EX = \int_Rxf(x)dx
EX=i=1∑nxipiEX=∫Rxf(x)dx
方差度量随机变量和其数学期望之间的偏离程度,记为
D
X
=
E
[
(
X
−
E
X
)
2
]
DX = E[(X - EX)^2]
DX=E[(X−EX)2]多维随机变量之间不独立,那么使用协方差衡量两个变量的总体误差,形如
C
o
v
(
X
,
Y
)
=
E
[
(
X
−
E
X
)
(
Y
−
E
Y
)
]
Cov(X, Y) = E[(X - EX)(Y - EY)]
Cov(X,Y)=E[(X−EX)(Y−EY)]并记
ρ
x
y
=
C
o
v
(
X
,
Y
)
/
(
D
X
⋅
D
Y
)
1
/
2
\rho_{xy} = Cov(X, Y)/(DX·DY)^{1/2}
ρxy=Cov(X,Y)/(DX⋅DY)1/2为相关系数,其表征了变量之间线性相关程度。
二、大数定律与中心极限定理
大数定律与中心极限定理对概率与频率,以及相关数字特征的关系做出了一定的阐述。
2.1 切比雪夫不等式
设随机变量
X
X
X的数学期望与方差存在,则对任意实数
ϵ
>
0
\epsilon > 0
ϵ>0,恒有
P
(
∣
X
−
E
X
∣
≥
ϵ
)
≤
D
X
/
ϵ
2
P(|X - EX| \ge \epsilon) \le DX/\epsilon^2
P(∣X−EX∣≥ϵ)≤DX/ϵ2其刻画了随机变量的数学期望与方差的关系,即方差越小的随机变量与其数学期望相近的概率越大。
2.2 大数定律
大数定律描述了随机变量序列的算术平均值向随机变量各数学期望的算术平均值收敛的性质。直观来讲,在随机事件的大量重复出现中,往往呈现几乎必然的规律,这个规律就是大数定律。在试验不变的条件下,重复试验多次,随机事件的频率近似于它的概率。
考虑相互独立的具有相同数学期望的随机变量序列 { X n } \{X_n\} {Xn},若随机变量的方差存在且有共同上界,那么随机变量序列服从切比雪夫大数定律,对任意实数 ϵ > 0 \epsilon > 0 ϵ>0,恒有 l i m n → + ∞ P { ∣ 1 / n ⋅ ∑ i = 1 n X i − 1 / n ⋅ ∑ i = 1 n E X i ∣ < ϵ } = 1 lim_{n \rightarrow +\infty} P\{|1/n·\sum_{i=1}^nX_i - 1/n·\sum_{i=1}^nEX_i|< \epsilon\} = 1 limn→+∞P{∣1/n⋅i=1∑nXi−1/n⋅i=1∑nEXi∣<ϵ}=1其刻画了任意分布之间随机变量与其数学期望的关系。
考虑 μ \mu μ是n重伯努利试验中事件发生的次数,事件发生的概率已知为 p p p,那么频率与概率服从伯努利大数定律,对任意实数 ϵ > 0 \epsilon > 0 ϵ>0,恒有 l i m n → + ∞ P { ∣ μ / n − p ∣ < ϵ } = 1 lim_{n \rightarrow +\infty} P\{|\mu/n - p|< \epsilon\} = 1 limn→+∞P{∣μ/n−p∣<ϵ}=1其刻画了频率与概率的关系。
考虑相互独立同分布的随机变量序列 { X n } \{X_n\} {Xn},那么随机变量序列服从辛钦大数定律,对任意实数 ϵ > 0 \epsilon > 0 ϵ>0,恒有 l i m n → + ∞ P { ∣ 1 / n ⋅ ∑ i = 1 n X i − E X ∣ < ϵ } = 1 lim_{n \rightarrow +\infty} P\{|1/n·\sum_{i=1}^nX_i - EX|< \epsilon\} = 1 limn→+∞P{∣1/n⋅i=1∑nXi−EX∣<ϵ}=1其刻画了同分布之间随机变量与其数学期望的关系。
2.3 中心极限定理
中心极限定理,是指讨论随机变量序列部分和分布渐近于正态分布的一类定理,是数理统计学和误差分析的理论基础,指出了大量随机变量近似服从正态分布的条件。
假设独立同分布的随机变量序列 { X n } \{X_n\} {Xn},对于任意实数 x x x,有列维-林德伯格【Lindburg-Levy】定理,形如 l i m n → + ∞ P { ( ∑ i = 1 n X i − n E X ) / ( ( n D X ) 1 / 2 ) ≤ x } = Φ ( x ) lim_{n \rightarrow +\infty} P\{ (\sum_{i=1}^nX_i - nEX)/((nDX)^{1/2}) \le x \} = \Phi(x) limn→+∞P{(i=1∑nXi−nEX)/((nDX)1/2)≤x}=Φ(x)其刻画了大量独立同分布的随机变量近似服从于正态分布。
假设 Y ∼ B ( n , p ) Y \sim B(n, p) Y∼B(n,p),对于任意实数 x x x,有棣莫弗-拉普拉斯【DeMoivre-Laplace】定理,形如 l i m n → + ∞ P { ( Y n − n p ) / ( n p ( 1 − p ) ) 1 / 2 ≤ x } = Φ ( x ) lim_{n \rightarrow +\infty} P\{ (Y_n - np)/(np(1-p))^{1/2} \le x \} = \Phi(x) limn→+∞P{(Yn−np)/(np(1−p))1/2≤x}=Φ(x)其刻画了二项分布以正态分布为其极限分布的规律。
三、数理统计
概率论是演绎,从先验知识推出结论。而数理统计是归纳,是从观测中估算后验知识。
3.1 样本数字特征
在n个独立且与总体
X
X
X具有同分布的随机变量
{
X
n
}
\{X_n\}
{Xn}所组成的整体称为来自
X
X
X的简单随机样本,而一次抽样结果的具体数值
{
x
n
}
\{x_n\}
{xn}称为样本的观测值。
设
{
X
n
}
\{X_n\}
{Xn}是来自总体
X
X
X的随机简单样本,那么有如下的数字特征:
-样本均值,
X
ˉ
=
∑
i
=
1
n
X
i
/
n
\bar{X} = \sum_{i=1}^n X_i/n
Xˉ=∑i=1nXi/n;
-样本方差,
S
2
=
∑
i
=
1
n
(
X
i
−
X
ˉ
)
/
(
n
−
1
)
S^2 = \sum_{i=1}^n (X_i - \bar{X})/(n-1)
S2=∑i=1n(Xi−Xˉ)/(n−1);
-样本矩,
A
k
=
∑
i
=
1
n
X
i
k
/
n
A_k = \sum_{i=1}^n X_i^k/n
Ak=∑i=1nXik/n;
-样本中心矩,
B
k
=
∑
i
=
1
n
(
X
i
−
X
ˉ
)
k
/
n
B_k = \sum_{i=1}^n (X_i - \bar{X})^k/n
Bk=∑i=1n(Xi−Xˉ)k/n;
3.2 抽样分布
若
X
1
,
.
.
.
,
X
n
X_1, ..., X_n
X1,...,Xn独立同分布于标准正态分布,则
X
=
∑
i
=
1
n
X
i
2
X = \sum_{i=1}^n X_i^2
X=i=1∑nXi2服从于自由度为
n
n
n的卡方【
χ
2
\chi^2
χ2】分布,记
X
∼
χ
2
(
n
)
X \sim \chi^2(n)
X∼χ2(n)。卡方分布在
n
=
1
n = 1
n=1时为正态分布的平方,而在
n
→
+
∞
n \rightarrow +\infty
n→+∞时为正态分布。卡方分布的数字特征为
E
X
=
n
,
D
X
=
2
n
EX = n, DX = 2n
EX=n,DX=2n。
若 X ∼ N ( 0 , 1 ) X \sim N(0, 1) X∼N(0,1)时, Y ∼ χ 2 ( n ) Y \sim \chi^2(n) Y∼χ2(n), X X X与 Y Y Y相互独立,则称 t = X / ( Y / N ) 1 / 2 t = X/(Y/N)^{1/2} t=X/(Y/N)1/2服从于自由度为 n n n的学生氏【Student’s t,t】分布,记 t ∼ t ( n ) t \sim t(n) t∼t(n)。t分布应用在对呈正态分布的总体的均值进行估计。
若 X ∼ χ 2 ( n 1 ) X \sim \chi^2(n_1) X∼χ2(n1), Y ∼ χ 2 ( n 2 ) Y \sim \chi^2(n_2) Y∼χ2(n2),且 X X X与 Y Y Y相互独立,则称 F = ( X / n 1 ) / ( Y / n 2 ) F = (X/n_1)/(Y/n_2) F=(X/n1)/(Y/n2)服从于自由度为 ( n 1 , n 2 ) 的 (n_1, n_2)的 (n1,n2)的费歇尔【Fisher,F】分布,记 F ∼ F ( n 1 , n 2 ) F \sim F(n_1, n_2) F∼F(n1,n2)。
3.3 正态统计分布
若
X
1
,
.
.
.
,
X
n
X_1, ..., X_n
X1,...,Xn独立同分布于标准正态分布,令
U
=
∑
i
=
1
n
X
i
/
n
U = \sum_{i=1}^nX_i/n
U=∑i=1nXi/n,那么有
E
U
=
E
[
X
1
+
X
2
+
.
.
.
+
X
n
]
/
n
=
μ
D
U
=
D
[
X
1
+
X
2
+
.
.
.
+
X
n
]
/
n
2
=
σ
2
/
n
EU = E[X_1 + X_2 + ... + X_n]/n = \mu \\ DU = D[X_1 + X_2 + ... + X_n]/n^2 = \sigma^2/n
EU=E[X1+X2+...+Xn]/n=μDU=D[X1+X2+...+Xn]/n2=σ2/n则样本均值服从于正态分布
X
ˉ
∼
N
(
μ
,
σ
2
/
n
)
\bar{X} \sim N(\mu, \sigma^2/n)
Xˉ∼N(μ,σ2/n),即
X
ˉ
−
μ
σ
/
n
1
/
2
∼
N
(
0
,
1
)
\frac{\bar{X} - \mu}{\sigma/n^{1/2}} \sim N(0, 1)
σ/n1/2Xˉ−μ∼N(0,1)再考虑
Y
i
=
(
X
i
−
μ
)
/
σ
Y_i = (X_i - \mu)/\sigma
Yi=(Xi−μ)/σ,那么
Y
i
∼
N
(
0
,
1
)
Y_i \sim N(0, 1)
Yi∼N(0,1)。那么
(
n
−
1
)
S
2
/
σ
2
=
∑
i
=
1
n
(
X
i
−
X
ˉ
σ
)
2
=
∑
i
=
1
n
(
X
i
−
μ
σ
)
2
−
n
(
X
ˉ
−
μ
σ
)
2
\begin{aligned}(n-1)S^2/\sigma^2& = \sum_{i=1}^n(\frac{X_i-\bar{X}}{\sigma})^2 \\&=\sum_{i=1}^n(\frac{X_i-\mu}{\sigma})^2 - n(\frac{\bar{X} - \mu}{\sigma})^2 \end{aligned}
(n−1)S2/σ2=i=1∑n(σXi−Xˉ)2=i=1∑n(σXi−μ)2−n(σXˉ−μ)2在此,不做证明地,上式服从于
χ
2
(
n
−
1
)
\chi^2(n-1)
χ2(n−1)。
3.3 参数估计
设总体
X
X
X的分布函数为
F
(
x
;
θ
)
F(x;\theta)
F(x;θ),通过样本构造一个合适的统计量
θ
^
(
X
1
,
.
.
.
,
X
n
)
\hat\theta(X_1, ..., X_n)
θ^(X1,...,Xn)作为
θ
\theta
θ的的估计,称为参数估计。
矩估计法是一种参数估计方法,其使用样本的矩来估计总体的矩,一般使用一阶矩 E X EX EX与二阶矩 E X 2 EX^2 EX2。令样本的矩与总体的矩相等,可以得到参数的估计值。
最大似然估计是一种参数估计方法,其使用似然函数 L ( θ ) = ∏ p ( θ ) L(\theta) = \prod p(\theta) L(θ)=∏p(θ)来计算 θ \theta θ为何值时概率取得最大。通过令 d L ( θ ) / d θ = 0 dL(\theta)/d\theta = 0 dL(θ)/dθ=0,得到参数的估计值。
估计量有如下评价标准:
-若
E
[
θ
^
]
=
θ
E[\hat\theta] = \theta
E[θ^]=θ,则称该估计值具有无偏性。
-若在无偏的情况下,
D
[
θ
^
1
]
<
D
[
θ
^
2
]
D[\hat\theta_1] < D[\hat\theta_2]
D[θ^1]<D[θ^2],则称
θ
^
1
\hat\theta_1
θ^1更具有有效性;
-若任取
ϵ
>
0
\epsilon > 0
ϵ>0,都有
l
i
m
n
→
+
∞
P
{
∣
θ
^
−
θ
∣
<
ϵ
}
=
1
lim_{n \rightarrow +\infty} P\{|\hat\theta - \theta| < \epsilon\} = 1
limn→+∞P{∣θ^−θ∣<ϵ}=1,则称该估计值具有一致性。
3.4 区间估计
设总体
X
X
X的数学期望为
μ
\mu
μ,样本均值为
X
ˉ
\bar{X}
Xˉ,则
p
{
∣
X
ˉ
−
μ
∣
<
Δ
}
=
1
−
α
p\{|\bar{X} - \mu| < \Delta\} = 1 - \alpha
p{∣Xˉ−μ∣<Δ}=1−α其中,
α
\alpha
α称为显著性水平。
3.5 假设检验
已知假设
H
0
:
μ
=
μ
0
H_0: \mu = \mu_0
H0:μ=μ0,与其备择假设
H
1
:
μ
≠
μ
0
H_1:\mu \ne \mu_0
H1:μ=μ0,则
p
{
∣
X
ˉ
−
μ
∣
<
Δ
}
=
1
−
α
p\{|\bar{X} - \mu| < \Delta\} = 1 - \alpha
p{∣Xˉ−μ∣<Δ}=1−α其中,
∣
X
ˉ
−
μ
0
∣
≥
Δ
|\bar{X} - \mu_0| \ge \Delta
∣Xˉ−μ0∣≥Δ是小概率事件。若其发生,则称拒绝
H
0
H_0
H0假设。、
若
H
0
H_0
H0为真,但假设检验法则拒绝,则称为一类错误;若
H
0
H_0
H0不真,但假设检验法则接收,则称为二类错误。