-/+9-*–@TOC
一、概率的基本概念
1.随机试验
随机试验的特点:
1.可以在相同的条件下重复地进行
2.每次试验的可能结果不止一个,并且能事先明确试验的所有可能结果
3.进行一次试验之前不能确定哪一个结果会出现
2.样本空间、随机事件
事件的运算关系:
设:A,B,C为事件,则:
A∪B=B∪A
A∩B=B∩A
A∪(B∪C)=A∪B∪C
A∩(B∩C)=A∩B∩C
A∪(B∩C)=(A∪B)∩(A∪C)
A∩(B∪C)=(A∩B)∪(A∩C)
德摩根律:
A
⋃
B
‾
=
A
‾
⋂
B
‾
,
A
⋂
B
‾
=
A
‾
⋃
B
‾
\overline{A\bigcup B}=\overline{A}\bigcap\overline{B},\overline{A\bigcap B}=\overline{A}\bigcup \overline{B}
A⋃B=A⋂B,A⋂B=A⋃B
3.频率与概率
频率的定义:在相同的条件下,进行了n次试验,在这n次试验中,事件A发生的次数m,称为事件A发生的频率。
概率的定义:设E是随机试验,S是样本空间,对于E的每一个事件A赋予一个实数,记P(A),称为事件A的概率,并满足:
- 非负性:对于每个事件,都有 P ( A ) ≥ 0 P(A)\geq 0 P(A)≥0
- 规范性:必然事件S 有 P ( S ) = 1 P(S)=1 P(S)=1
- 可列可加性:
对
于
事
件
A
1
,
A
2
.
.
.
A
n
两
两
互
不
容
,
即
A
i
A
j
=
∅
有
:
P
(
A
1
⋃
A
2
⋃
.
.
.
A
n
)
=
P
(
A
1
)
⋃
P
(
A
2
)
⋃
.
.
.
⋃
A
n
对于事件A_1,A_2...A_n两两互不容,即A_iA_j=\emptyset有:P(A_1\bigcup A_2\bigcup ...A_n)=P(A_1)\bigcup P(A_2)\bigcup...\bigcup A_n
对于事件A1,A2...An两两互不容,即AiAj=∅有:P(A1⋃A2⋃...An)=P(A1)⋃P(A2)⋃...⋃An
概率的性质: - P ( ∅ ) = 0 P(\emptyset) = 0 P(∅)=0
- P ( S ) = 1 P(S)=1 P(S)=1
- 可 列 可 加 性 : 对 于 事 件 A 1 , A 2 . . . A n 两 两 互 不 容 , 即 A i A j = ∅ 有 : P ( A 1 ⋃ A 2 ⋃ . . . A n ) = P ( A 1 ) ⋃ P ( A 2 ) ⋃ . . . ⋃ A n 可列可加性:对于事件A_1,A_2...A_n两两互不容,即A_iA_j=\emptyset有:P(A_1\bigcup A_2\bigcup ...A_n)=P(A_1)\bigcup P(A_2)\bigcup...\bigcup A_n 可列可加性:对于事件A1,A2...An两两互不容,即AiAj=∅有:P(A1⋃A2⋃...An)=P(A1)⋃P(A2)⋃...⋃An
- 若 A ⊂ B , P ( B − A ) = P ( B ) − P ( A ) ; P ( B ) ≥ P ( A ) 若A\subset B,P(B-A)=P(B)-P(A);P(B)\geq P(A) 若A⊂B,P(B−A)=P(B)−P(A);P(B)≥P(A)
- P ( A ‾ ) = 1 − P ( A ) P(\overline A)=1-P(A) P(A)=1−P(A)
-
(
加
法
公
式
)
:
P
(
A
⋃
B
)
=
P
(
A
)
+
P
(
B
)
−
P
(
A
B
)
;
(加法公式):P(A\bigcup B)=P(A)+P(B)-P(AB);
(加法公式):P(A⋃B)=P(A)+P(B)−P(AB);
推广,任意n个事件:
P ( A 1 ⋃ A 2 ⋃ . . . ⋃ A n ) = ∑ i = 1 n P ( A i ) − ∑ 1 ≤ i ≤ j ≤ n P ( A i A j ) + ∑ 1 ≤ i ≤ j ≤ k ≤ n P ( A i A j A k ) + . . . + ( − 1 ) n − 1 p ( A 1 A 2 A 3 . . . . A n ) P(A_1\bigcup A_2 \bigcup ...\bigcup A_n)=\sum^n_{i=1}P(A_i)-\sum_{1\leq i\leq j\leq n}P(A_iA_j)+\sum_{1\leq i\leq j\leq k\leq n}P(A_iA_jA_k)+...+(-1)^{n-1}p(A_1A_2A_3....A_n) P(A1⋃A2⋃...⋃An)=∑i=1nP(Ai)−∑1≤i≤j≤nP(AiAj)+∑1≤i≤j≤k≤nP(AiAjAk)+...+(−1)n−1p(A1A2A3....An)
加法公式:
P
(
A
⋃
B
)
=
P
(
A
)
+
P
(
B
)
−
P
(
A
B
)
;
P(A\bigcup B)=P(A)+P(B)-P(AB);
P(A⋃B)=P(A)+P(B)−P(AB);
推广,任意n个事件:
P
(
A
1
⋃
A
2
⋃
.
.
.
⋃
A
n
)
=
∑
i
=
1
n
P
(
A
i
)
−
∑
1
≤
i
≤
j
≤
n
P
(
A
i
A
j
)
+
∑
1
≤
i
≤
j
≤
k
≤
n
P
(
A
i
A
j
A
k
)
+
.
.
.
+
(
−
1
)
n
−
1
p
(
A
1
A
2
A
3
.
.
.
.
A
n
)
P(A_1\bigcup A_2 \bigcup ...\bigcup A_n)=\sum^n_{i=1}P(A_i)-\sum_{1\leq i\leq j\leq n}P(A_iA_j)+\sum_{1\leq i\leq j\leq k\leq n}P(A_iA_jA_k)+...+(-1)^{n-1}p(A_1A_2A_3....A_n)
P(A1⋃A2⋃...⋃An)=∑i=1nP(Ai)−∑1≤i≤j≤nP(AiAj)+∑1≤i≤j≤k≤nP(AiAjAk)+...+(−1)n−1p(A1A2A3....An)
4.古典概型(等可能概型)
- 有限性:试验样本空间只包含有限个元素
- 等可能性:试验中每个基本事件发生的可能性相等
排列(放回取样) A n k A^k_n Ank
无重复排列:n个元素取k个
A
n
k
=
n
!
(
n
−
k
)
!
A^k_n=\frac {n!}{(n-k)!}
Ank=(n−k)!n!
予许重复排列:n个元素取k个
n
k
n^k
nk
组合(无放回取样) C n k C^k_n Cnk
n个元素取k个: C n k = A n k k ! = n ! ( n − k ) ! k ! 记 作 : ( k n ) C^k_n=\frac{A^k_n}{k!}=\frac{n!}{(n-k)!k!} 记作:(^n_k) Cnk=k!Ank=(n−k)!k!n!记作:(kn)
5.条件概率
P
(
B
∣
A
)
,
事
件
A
成
立
的
条
件
下
B
成
立
的
概
率
P(B|A),事件A成立的条件下B成立的概率
P(B∣A),事件A成立的条件下B成立的概率
P
(
A
∣
B
)
=
P
(
A
B
)
P
(
B
)
P(A|B)=\frac{P(AB)}{P(B)}
P(A∣B)=P(B)P(AB)
P
(
A
B
)
=
P
(
B
)
P
(
A
∣
B
)
=
P
(
A
)
P
(
B
∣
A
)
P(AB)=P(B)P(A|B)=P(A)P(B|A)
P(AB)=P(B)P(A∣B)=P(A)P(B∣A)
乘法定理:
P ( A 1 A 2 . . . . A n ) = P ( A 1 ) P ( A 2 ∣ A 1 ) . . . P ( A n − 1 ∣ A 1 A 2 . . . A n − 2 ) P ( A n ∣ A 1 A 2 . . . A n − 1 ) P(A_1A_2....A_n)=P(A_1)P(A_2|A_1)...P(A_{n-1}|A_1A_2...A_{n-2})P(A_n|A_1A_2...A_{n-1}) P(A1A2....An)=P(A1)P(A2∣A1)...P(An−1∣A1A2...An−2)P(An∣A1A2...An−1)
全概率公式
若
B
1
⋃
B
2
⋃
.
.
.
⋃
B
n
=
S
,
B
i
B
j
=
∅
若B_1\bigcup B_2\bigcup...\bigcup B_n=S,B_iB_j=\emptyset
若B1⋃B2⋃...⋃Bn=S,BiBj=∅
则
:
P
(
A
)
=
P
(
B
1
)
P
(
A
∣
B
1
)
+
P
(
B
2
)
P
(
A
∣
B
2
)
+
.
.
.
+
P
(
B
n
)
P
(
A
∣
B
n
)
则:P(A)=P(B_1)P(A|B_1)+P(B_2)P(A|B_2)+...+P(B_n)P(A|B_n)
则:P(A)=P(B1)P(A∣B1)+P(B2)P(A∣B2)+...+P(Bn)P(A∣Bn)
贝叶斯公式
P
(
B
i
∣
A
)
=
P
(
A
∣
B
i
)
P
(
B
i
)
∑
j
=
1
n
P
(
A
∣
B
j
)
P
(
B
j
)
,
i
=
1
,
2
,
.
.
.
,
n
P(B_i|A)=\frac{P(A|B_i)P(B_i)}{\sum_{j=1}^nP(A|B_j)P(B_j)},i=1,2,...,n
P(Bi∣A)=∑j=1nP(A∣Bj)P(Bj)P(A∣Bi)P(Bi),i=1,2,...,n
证
:
P
(
B
i
∣
A
)
=
P
(
B
i
A
)
P
(
A
)
=
P
(
A
∣
B
i
)
P
(
B
i
)
∑
j
=
1
n
P
(
A
∣
B
j
)
P
(
B
j
)
证:P(B_i|A)=\frac{P(B_iA)}{P(A)}=\frac{P(A|B_i)P(B_i)}{\sum_{j=1}^nP(A|B_j)P(B_j)}
证:P(Bi∣A)=P(A)P(BiA)=∑j=1nP(A∣Bj)P(Bj)P(A∣Bi)P(Bi)
6.独立性
定义
设A,B,C是两事件,若
P
(
A
B
)
=
P
(
A
)
P
(
B
)
P(AB)=P(A)P(B)
P(AB)=P(A)P(B)则称A,B相互独立。
{
{
P
(
A
B
)
=
P
(
A
)
P
(
B
)
P
(
B
C
)
=
P
(
B
)
P
(
C
)
P
(
A
C
)
=
P
(
A
)
P
(
C
)
}
A
B
C
两
两
独
立
P
(
A
B
C
)
=
P
(
A
)
P
(
B
)
P
(
C
)
}
A
B
C
相
互
独
立
\begin{Bmatrix} {\begin{Bmatrix} P(AB)=P(A)P(B) \\ P(BC)=P(B)P(C)\\P(AC)=P(A)P(C) \\ \end{Bmatrix}\text ABC两两独立} \\ P(ABC)=P(A)P(B)P(C)\end{Bmatrix}\text ABC相互独立
⎩⎪⎪⎨⎪⎪⎧⎩⎨⎧P(AB)=P(A)P(B)P(BC)=P(B)P(C)P(AC)=P(A)P(C)⎭⎬⎫ABC两两独立P(ABC)=P(A)P(B)P(C)⎭⎪⎪⎬⎪⎪⎫ABC相互独立
二、随机变量及分布
1.随机变量
设随机试验的样本空间 S = e , X = X ( e ) S={e},X=X(e) S=e,X=X(e)是定义在样本空间S上的实值单值函数,称 X = X ( e ) X=X(e) X=X(e)为随机变量。
2.离散型随机变量及分布
随机变量,他们可能取到的值是有限个或可列无限多个,称离散性随机变量
(个人理解:1.个数有限或可列;2.有明确对应的值)
(0-1)分布 X~B(1,p)
随机变量X只可能取0与1两个值,分布律为
P
(
X
=
k
)
=
p
k
(
1
−
p
)
1
−
k
,
k
=
0
,
1
P(X=k)=p^k(1-p)^{1-k},k=0,1
P(X=k)=pk(1−p)1−k,k=0,1
记:X~B(1,p)
二项分布 X~B(n,p)
P
(
X
=
k
)
=
C
n
k
p
k
(
1
−
p
)
n
−
k
P(X=k)=C^k_np^k(1-p)^{n-k}
P(X=k)=Cnkpk(1−p)n−k
记:X~B(n,p)
泊松分布 X~ π ( λ ) \pi(\lambda) π(λ)
随机变量X所有的可能取值的概率为
P
(
X
=
k
)
=
λ
k
e
−
λ
k
!
,
k
=
1
,
2
,
.
.
.
P(X=k)=\frac{\lambda^ke^{-\lambda}}{k!},k=1,2,...
P(X=k)=k!λke−λ,k=1,2,...
记:X~
π
(
λ
)
\pi(\lambda)
π(λ)
泊松定理
设
λ
\lambda
λ>0是一个常数,n是任意正整数,设
n
p
n
=
λ
np_n=\lambda
npn=λ,则对于任一固定的非负整数k,有:
l
i
m
n
→
∞
C
n
k
p
n
k
(
1
−
p
)
n
−
k
=
λ
k
e
−
λ
k
!
lim_{n\to\infty}C^k_np^k_n(1-p)^{n-k}=\frac{\lambda^ke^{-\lambda}}{k!}
limn→∞Cnkpnk(1−p)n−k=k!λke−λ
所以当n很大,p很小时,
λ
=
n
p
\lambda=np
λ=np
P
(
X
=
k
)
=
C
n
k
p
k
(
1
−
p
)
n
−
k
≈
λ
k
e
−
λ
k
!
P(X=k)=C^k_np^k(1-p)^{n-k} \approx\frac{\lambda^ke^{-\lambda}}{k!}
P(X=k)=Cnkpk(1−p)n−k≈k!λke−λ
几何分布 X~G( p )
在伯努利试验中,设每次试验成功的概率均为p(0<p<1),独立重复试验直到首次成功为止,所需试验次数X服从几何分布。
P
(
X
=
k
)
=
q
k
−
1
(
1
−
q
)
P(X=k)=q^{k-1}(1-q)
P(X=k)=qk−1(1−q)
记:X~G( p )
几何分布的无记忆性:
设X~G( p ),n,m为任意的两个正整数,则
P
(
X
>
n
+
m
∣
X
>
n
)
=
P
(
X
>
m
)
P(X>n+m|X>n)=P(X>m)
P(X>n+m∣X>n)=P(X>m)
超几何分布
N件产品,其中M件次品,今从中任取n件,则n件中的次品数X的分布列:
P
(
X
=
k
)
=
C
M
k
C
N
−
M
n
−
k
C
N
n
P(X=k)=\frac{C^k_MC^{n-k}_{N-M}}{C^n_N}
P(X=k)=CNnCMkCN−Mn−k
3.随机变量的分布函数
对于非离散型随机变量X,由于其可能的取值不能一一列举出来,因而就不能像离散型随机变量那样可以用分布律来描述它。另外,我们通常所遇到的非离散型随机变量任取一指定的实数值的概率都等于0,因而我们转而去研究随机变量所取的值落在一个区间
(
x
1
,
x
2
]
(x_1,x_2]
(x1,x2]的概率P。
定义:设X是一个随机变量,x是任意实数
F
(
x
)
=
P
{
X
≤
x
}
F(x)=P\{X\leq x\}
F(x)=P{X≤x}
称为X的分布函数
因此,若已知X的分布函数,我们九就能得出X落在任意区间的概率,从这个意义上说,分布函数完整地秒速了随机变量的统计规律性。
分布函数的基本性质:
- F(x)是一个不减函数。
-
0
≤
F
(
x
)
≤
1
且
:
0\leq F(x)\leq 1且:
0≤F(x)≤1且:
F ( − ∞ ) = l i m x → − ∞ F ( x ) = 0 F(-\infty)=lim_{x \to-\infty}F(x)=0 F(−∞)=limx→−∞F(x)=0
F ( + ∞ ) = l i m x → + ∞ F ( x ) = 1 F(+\infty)=lim_{x \to+\infty}F(x)=1 F(+∞)=limx→+∞F(x)=1 - F(x+0)=F(x),即F(x)是右连续的。
4.连续性随机变量及概率密度
定义:设随机变量X的分布函数为F(x),存在非负函数f(x),对任意实数x,有
F
(
x
)
=
∫
−
∞
x
f
(
t
)
d
t
.
F(x)=\int^x_{-\infty}f(t)dt.
F(x)=∫−∞xf(t)dt.
称X为连续型随机变量,f(x)为X的概率密度
性质:
- f ( x ) ≥ 0 f(x)\geq0 f(x)≥0.
- ∫ − ∞ ∞ f ( x ) d x = 1. \int ^{\infty}_{-\infty}f(x)dx=1. ∫−∞∞f(x)dx=1.
- 对任意实数 x 1 , x 2 ( x 1 ≤ x 2 ) , P { x 1 < X ≤ x 2 } = F ( x 1 ) − F ( x 1 ) = ∫ x 1 x 2 f ( x ) d x . x_1,x_2(x_1\leq x_2),P\{x_1< X\leq x_2\}=F(x_1)-F(x_1)=\int_{x_1}^{x_2}f(x)dx. x1,x2(x1≤x2),P{x1<X≤x2}=F(x1)−F(x1)=∫x1x2f(x)dx.
- 若 f ( x ) 在 点 x 处 连 续 , 则 F ′ ( x ) = f ( x ) \text若f(x)在点x处连续,则F'(x)=f(x) 若f(x)在点x处连续,则F′(x)=f(x)
推导:
- 连续型随机变量的分布函数一定是连续的
- F ( x ) 与 f ( x ) 可 以 相 互 推 导 F(x)与f(x)可以相互推导 F(x)与f(x)可以相互推导
均匀分布 X~U(a,b)
连续型随机变量X的概率密度为:
概率密度:
f
(
x
)
=
{
1
(
b
−
a
)
,
a
<
x
<
b
0
,
其
他
}
f(x)=\begin{Bmatrix}\frac{1}{(b-a)},a<x<b\\0,其他\end{Bmatrix}
f(x)={(b−a)1,a<x<b0,其他}
→
\to
→分布函数:
F
(
x
)
=
{
0
,
x
<
a
x
−
a
b
−
a
,
a
≤
x
<
b
1
,
x
≥
b
}
F(x)=\begin{Bmatrix}0,x<a\\\frac{x-a}{b-a},a\leq x<b\\1,x\geq b\end{Bmatrix}
F(x)=⎩⎨⎧0,x<ab−ax−a,a≤x<b1,x≥b⎭⎬⎫
指数分布 X~E( λ \lambda λ)
概率密度:
f
(
x
)
=
{
1
θ
e
−
x
/
θ
,
x
>
0
0
,
其
他
}
f(x)=\begin{Bmatrix}\frac{1}{\theta}e^{-x/\theta},x>0\\0,其他\end{Bmatrix}
f(x)={θ1e−x/θ,x>00,其他}
其
中
θ
>
0
为
常
数
其中\theta>0为常数
其中θ>0为常数
→
\to
→分布函数:
F
(
x
)
=
{
1
−
e
−
λ
x
,
x
>
0
0
,
其
他
}
F(x)=\begin{Bmatrix}1-e^{-\lambda x},x>0\\0,其他\end{Bmatrix}
F(x)={1−e−λx,x>00,其他}
无记忆性:
对于任意s,t>0有:
P
{
X
>
s
+
t
∣
X
>
s
}
=
P
{
X
>
t
}
P\{X>s+t|X>s\}=P\{X>t\}
P{X>s+t∣X>s}=P{X>t}
正态分布 X~N( μ , σ 2 \mu, \sigma^2 μ,σ2)
概率密度:
f
(
x
)
=
1
2
π
σ
e
−
(
x
−
μ
)
2
2
μ
2
,
−
∞
<
x
<
∞
f(x)=\frac{1}{\sqrt{2\pi}\sigma}e^{-\frac{(x-\mu)^2}{2\mu^2}},-\infty<x<\infty
f(x)=2πσ1e−2μ2(x−μ)2,−∞<x<∞
μ
\mu
μ,
σ
\sigma
σ为常数,且
σ
>
0
\sigma>0
σ>0,称X服从参数为
μ
\mu
μ,
σ
\sigma
σ的正态分布或高斯分布
函数性质:
- 关于 x = μ x=\mu x=μd对称
- 当 x = μ x=\mu x=μ时,取得最大值 1 2 π σ \frac{1}{\sqrt{2\pi}\sigma} 2πσ1
- 当 x → ± ∞ x\to\pm\infty x→±∞时, f ( x ) → 0 f(x)\to0 f(x)→0
- x = μ ± σ x=\mu\pm\sigma x=μ±σ处出现拐点
- μ \mu μ决定对称轴位置,当 σ \sigma σ固定时, μ \mu μ改变,函数图形不变,只做平移
- σ \sigma σ决定函数离散性,当 μ \mu μ固定时, σ \sigma σ越大,离散情况越明显
标准正态分布 X~N(0,1)
概率密度:
ψ
(
x
)
=
1
2
π
e
−
x
2
2
\psi(x)=\frac{1}{\sqrt{2\pi}}e^{-\frac{x^2}{2}}
ψ(x)=2π1e−2x2
分布函数:
ϕ
(
x
)
=
1
2
π
∫
−
∞
x
e
−
t
2
2
d
t
\phi(x)=\frac{1}{\sqrt{2\pi}}\int ^x_{-\infty}e^{-\frac{t^2}{2}}dt
ϕ(x)=2π1∫−∞xe−2t2dt
性质:
ψ
(
x
)
=
ψ
(
−
x
)
,
ϕ
(
x
)
=
1
−
ϕ
(
−
x
)
\psi(x)=\psi(-x),\phi(x)=1-\phi(-x)
ψ(x)=ψ(−x),ϕ(x)=1−ϕ(−x)
一般正态分布N(
μ
\mu
μ,
σ
2
\sigma^2
σ2)的分布函数F(x)与标准正态分布的分布函数
ϕ
(
x
)
\phi(x)
ϕ(x)的关系为:
F
(
x
)
=
ϕ
(
x
−
μ
σ
)
F(x)=\phi(\frac{x-\mu}{\sigma})
F(x)=ϕ(σx−μ)
即:X~N(
μ
\mu
μ,
σ
2
\sigma^2
σ2)则:
X
−
μ
σ
\frac{X-\mu}{\sigma}
σX−μ ~N(0,1)
5.随机变量的函数的分布
对随机变量的函数
Y
=
g
(
X
)
Y=g(X)
Y=g(X),已知随机变量X的分布,如何求的随机变量Y的分布。
已知X的概率密度为
f
x
(
x
)
f_x(x)
fx(x),分布函数
F
x
(
x
)
F_x(x)
Fx(x),
Y
=
g
(
X
)
Y=g(X)
Y=g(X),求Y的概率密度
f
Y
(
y
)
f_Y(y)
fY(y)
分布函数法
- F Y ( y ) = P ( Y ≤ y ) = P { g ( X ) ≤ y } → 表 示 成 X 的 分 布 函 数 F_Y(y)=P(Y\leq y)=P\{g(X)\leq y\}\to表示成X的分布函数 FY(y)=P(Y≤y)=P{g(X)≤y}→表示成X的分布函数
- 求导数: f Y ( y ) = F Y ′ ( y ) f_Y(y)=F'_Y(y) fY(y)=FY′(y)
公式法
定理:设X的概率密度
f
x
(
x
)
f_x(x)
fx(x),y=g(X)为(a,b)上严格单调可微函数
(
−
∞
≤
a
≤
b
≤
+
∞
)
(-\infty\leq a\leq b\leq+\infty)
(−∞≤a≤b≤+∞),则Y=g(X)的概率密度为:
f
Y
(
y
)
=
{
f
x
[
h
(
y
)
]
∣
h
′
(
y
)
∣
,
A
<
y
<
B
0
,
其
他
}
f_Y(y)=\begin{Bmatrix}f_x[h(y)]|h'(y)|,A<y<B\\0,其他\end{Bmatrix}
fY(y)={fx[h(y)]∣h′(y)∣,A<y<B0,其他}
其中h(y)为g(x)的反函数,A=min{g(a),g(b)},B=max{g(a),g(b)}
三、多维随机变量及分布
1.二维随机变量
定义
设E是一个随机试验,他的样本空间是S,设X=X(e)和Y=Y(e)是在S上的随机变量,由他们构成的一个向量(X,Y)叫做二维随机变量,对于任意实数x,y,二元函数:
F
(
x
,
y
)
=
P
{
(
X
≤
x
)
⋂
(
Y
≤
y
)
}
记
作
→
P
{
X
≤
x
,
Y
≤
y
}
→
二
维
随
机
变
量
的
分
布
函
数
F(x,y)=P\{(X \leq x)\bigcap (Y\leq y)\}\underrightarrow{记作}P\{X\leq x,Y\leq y\}\to二维随机变量的分布函数
F(x,y)=P{(X≤x)⋂(Y≤y)}记作P{X≤x,Y≤y}→二维随机变量的分布函数
基本性质:
- 对任意实数x,y有 0 ≤ F ( x , y ) ≤ 1 0\leq F(x,y)\leq1 0≤F(x,y)≤1;
- F ( x , y 1 ) ≤ f ( x , y 2 ) , y 1 < y 2 F ( x 1 , y ) ≤ f ( x 2 , y ) , x 1 < x 2 即F(x,y)对每个自变量都是单调不减 F(x,y_1)\leq f(x,y_2),y_1<y_2\\F(x_1,y)\leq f(x_2,y),x_1<x_2\\\text{即F(x,y)对每个自变量都是单调不减} F(x,y1)≤f(x,y2),y1<y2F(x1,y)≤f(x2,y),x1<x2即F(x,y)对每个自变量都是单调不减
- 对任意x,y有 F ( − ∞ , y ) = l i m x → − ∞ F ( x , y ) = 0 ; F ( x , − ∞ ) = l i m y → − ∞ F ( x , y ) = 0 ; F ( − ∞ , − ∞ ) = l i m x → − ∞ , y → − ∞ F ( x , y ) = 0 ; F ( ∞ , ∞ ) = l i m x → ∞ , y → ∞ F ( x , y ) = 1 F(-\infty,y)=lim_{x\to-\infty}F(x,y)=0;\\F(x,-\infty)=lim_{y\to-\infty}F(x,y)=0;\\F(-\infty,-\infty)=lim_{x\to-\infty,y\to-\infty}F(x,y)=0;\\F(\infty,\infty)=lim_{x\to\infty,y\to\infty}F(x,y)=1 F(−∞,y)=limx→−∞F(x,y)=0;F(x,−∞)=limy→−∞F(x,y)=0;F(−∞,−∞)=limx→−∞,y→−∞F(x,y)=0;F(∞,∞)=limx→∞,y→∞F(x,y)=1
- F(x,y)关于x右连续,关于y也右连续;
- 对任意实数 x 1 ≤ x 2 , y 1 ≤ y 2 , 有 F ( x 2 , y 2 ) − f ( x 2 , y 1 ) − F ( x 1 , y 2 ) + F ( x 2 , y 2 ) ≥ 0 x_1\leq x_2,y_1\leq y_2,有\\F(x_2,y_2)-f(x_2,y_1)-F(x_1,y_2)+F(x_2,y_2)\geq 0 x1≤x2,y1≤y2,有F(x2,y2)−f(x2,y1)−F(x1,y2)+F(x2,y2)≥0
离散型的随机变量:二维随机变量(X,Y)全部可能取到的值是有限对或可列无限多对。
连续的二维随机变量:二维随机变量(X,Y)的分布函数F(x,y)存在非负可积函数
f
(
x
,
y
)
使
对
于
任
意
x
.
y
有
:
F
(
x
,
y
)
=
∫
−
∞
y
∫
−
∞
x
f
(
u
,
v
)
d
u
d
v
f
(
x
,
y
)
为
二
维
随
机
变
量
的
概
率
密
度
f(x,y)使对于任意x.y有:\\F(x,y)=\int_{-\infty}^y\int_{-\infty}^xf(u,v)dudv\\f(x,y)为二维随机变量的概率密度
f(x,y)使对于任意x.y有:F(x,y)=∫−∞y∫−∞xf(u,v)dudvf(x,y)为二维随机变量的概率密度
2.边缘分布
设二维随机变量(X,Y)的分布函数F(x,y),X和Y各自的分布函数
F
X
(
x
)
F_X(x)
FX(x)和
F
Y
(
y
)
F_Y(y)
FY(y)为F(x,y)的边缘函数。即:
F
X
(
x
)
=
P
(
X
≤
x
)
=
P
(
X
≤
x
,
Y
≤
∞
)
=
F
(
x
,
∞
)
=
l
i
n
y
→
∞
F
(
x
,
y
)
同
理
:
F
Y
(
y
)
=
F
(
∞
,
y
)
=
l
i
n
x
→
∞
F
(
x
,
y
)
F_X(x)=P(X\leq x )=P(X\leq x,Y\leq \infty)\\=F(x,\infty)=lin_{y\to\infty}F(x,y)\\同理:F_Y(y)=F(\infty,y)=lin_{x\to\infty}F(x,y)
FX(x)=P(X≤x)=P(X≤x,Y≤∞)=F(x,∞)=liny→∞F(x,y)同理:FY(y)=F(∞,y)=linx→∞F(x,y)
二维均匀分布
二维随机变量(X,Y)具有概率密度:
f
(
x
,
y
)
=
{
1
S
(
G
)
,
(
x
,
y
)
∈
G
0
,
其
他
}
f(x,y)=\begin{Bmatrix}\frac{1}{S(G)},(x,y)\in G\\0,其他\end{Bmatrix}
f(x,y)={S(G)1,(x,y)∈G0,其他}
称(X,Y)在G上服从均匀分布。
f
(
x
,
y
)
≥
0
,
且
∫
−
∞
∞
∫
−
∞
∞
f
(
x
,
y
)
d
x
d
y
=
∫
∫
G
1
S
(
G
)
d
x
d
y
=
1
f(x,y)\geq 0,且\int_{-\infty}^\infty\int_{-\infty}^\infty f(x,y)dxdy=\int\int_G\frac{1}{S(G)}dxdy=1
f(x,y)≥0,且∫−∞∞∫−∞∞f(x,y)dxdy=∫∫GS(G)1dxdy=1
二维正态分布
概率密度:
f
(
x
,
y
)
=
1
2
π
σ
1
σ
2
1
−
ρ
2
e
x
p
{
−
1
2
(
1
−
ρ
2
)
∗
[
(
x
−
μ
1
)
2
σ
1
2
−
2
ρ
(
x
−
μ
1
)
(
y
−
μ
2
)
σ
1
σ
2
+
(
y
−
μ
2
)
2
σ
2
2
]
}
f(x,y)=\frac{1}{2 \pi \sigma _1 \sigma_2\sqrt{1-\rho^2}}exp\begin{Bmatrix}-\frac{1}{2(1-\rho^2)}*[\frac{(x-\mu_1)^2}{\sigma_1^2}-2\rho\frac{(x-\mu_1)(y-\mu_2)}{\sigma_1\sigma_2}+\frac{(y-\mu_2)^2}{\sigma_2^2}]\end{Bmatrix}
f(x,y)=2πσ1σ21−ρ21exp{−2(1−ρ2)1∗[σ12(x−μ1)2−2ρσ1σ2(x−μ1)(y−μ2)+σ22(y−μ2)2]}
其中
μ
1
,
μ
2
,
σ
1
>
0
,
σ
2
>
0
,
∣
ρ
∣
<
1
,
都
是
常
数
记
:
(
X
,
Y
)
\mu_1,\mu_2,\sigma_1>0,\sigma_2>0,|\rho|<1,都是常数\\记:(X,Y)
μ1,μ2,σ1>0,σ2>0,∣ρ∣<1,都是常数记:(X,Y)~N
(
μ
1
,
μ
2
;
σ
1
2
,
σ
2
2
;
ρ
)
(\mu_1,\mu_2;\sigma_1^2,\sigma_2^2;\rho)
(μ1,μ2;σ12,σ22;ρ)
二维正态分布的两个边缘分布都是一维正态分布:
X~N(
μ
1
,
σ
1
2
\mu_1,\sigma_1^2
μ1,σ12)
Y~N(
μ
2
,
σ
2
2
\mu_2,\sigma^2_2
μ2,σ22)
3.条件分布
4.相互独立的随机变量
定义:设F(x,y),F(x,),F(y)依次为(X,Y),X,Y的分布函数,对任意实数x,y成立。
F
(
x
,
y
)
=
F
X
(
x
)
F
Y
(
y
)
F(x,y)=F_X(x)F_Y(y)
F(x,y)=FX(x)FY(y)
称X与Y相互独立。即联合概率密度等于边缘函数的乘积
5.两个随机变量的函数的分布
Z=X+Y的分布(积卷公式)
设(X,Y)是二维连续型随机变量,概率密度为
f
(
x
,
y
)
f(x,y)
f(x,y),则Z=X+Y仍为连续型随机变量,其概率密度:
f
X
+
Y
(
z
)
=
∫
−
∞
∞
f
(
z
−
y
,
y
)
d
y
f_{X+Y}(z)=\int _{-\infty}^\infty f(z-y,y)dy
fX+Y(z)=∫−∞∞f(z−y,y)dy
或:
f
X
+
Y
(
z
)
=
∫
−
∞
∞
f
(
x
,
z
−
x
)
d
x
f_{X+Y}(z)=\int _{-\infty}^\infty f(x,z-x)dx
fX+Y(z)=∫−∞∞f(x,z−x)dx
若X,Y相互独立,X,Y的边缘密度分别为
f
x
(
x
)
,
f
y
(
y
)
f_x(x),f_y(y)
fx(x),fy(y),Z的概率密度为:
f
X
+
Y
(
z
)
=
∫
−
∞
∞
f
X
(
z
−
y
)
f
Y
(
y
)
d
y
f_{X+Y}(z)=\int _{-\infty}^\infty f_X(z-y)f_Y(y)dy
fX+Y(z)=∫−∞∞fX(z−y)fY(y)dy
或:
f
X
+
Y
(
z
)
=
∫
−
∞
∞
f
X
(
x
)
f
Y
(
z
−
x
)
d
x
f_{X+Y}(z)=\int _{-\infty}^\infty f_X(x)f_Y(z-x)dx
fX+Y(z)=∫−∞∞fX(x)fY(z−x)dx
称为fx,fy的积卷公式
X
i
−
N
(
μ
,
σ
2
)
(
i
=
1
,
2
,
3...
)
且
相
互
独
立
Z
=
X
1
+
X
2
+
.
.
.
+
X
i
Z
−
N
(
μ
1
+
μ
2
+
.
.
.
+
μ
i
,
σ
1
2
+
σ
2
2
+
.
.
.
+
σ
i
2
)
X_i - N(\mu,\sigma^2) (i=1,2,3...)且相互独立\\ Z=X_1+X2+...+X_i\\ Z-N(\mu_1+\mu_2+...+\mu_i,\sigma_1^2+\sigma_2^2+...+\sigma^2_i)
Xi−N(μ,σ2)(i=1,2,3...)且相互独立Z=X1+X2+...+XiZ−N(μ1+μ2+...+μi,σ12+σ22+...+σi2)
Z= Y X \frac{Y}{X} XY的分布
设(X,Y)是二维连续随机型变量,概率密度
f
(
x
,
y
)
f(x,y)
f(x,y),则Z=
Y
X
\frac{Y}{X}
XY、Z=XY仍为连续型随机变量,其概率密度:
f
Y
/
X
(
z
)
=
∫
−
∞
∞
∣
x
∣
f
(
x
,
x
z
)
d
x
f
X
Y
(
z
)
=
∫
−
∞
∞
1
∣
x
∣
f
(
x
,
z
x
)
d
x
f_{Y/X}(z)=\int_{-\infty}^\infty|x|f(x,xz)dx\\ f_{XY}(z)=\int_{-\infty}^\infty\frac{1}{|x|}f(x,\frac{z}{x})dx
fY/X(z)=∫−∞∞∣x∣f(x,xz)dxfXY(z)=∫−∞∞∣x∣1f(x,xz)dx
若X和Y相互独立,边缘密度为
f
X
(
x
)
,
f
Y
(
y
)
f_X(x),f_Y(y)
fX(x),fY(y)
f
Y
/
X
(
z
)
=
∫
−
∞
∞
∣
x
∣
f
x
(
x
)
f
Y
(
x
z
)
d
x
f
Y
X
(
z
)
=
∫
−
∞
∞
1
∣
x
∣
f
x
(
x
)
f
Y
(
z
x
)
d
x
f_{Y/X}(z)=\int_{-\infty}^\infty|x|f_x(x)f_Y(xz)dx\\ f_{YX}(z)=\int_{-\infty}^\infty\frac{1}{|x|}f_x(x)f_Y(\frac{z}{x})dx
fY/X(z)=∫−∞∞∣x∣fx(x)fY(xz)dxfYX(z)=∫−∞∞∣x∣1fx(x)fY(xz)dx
M=max{X,Y}及N=min{X,Y}的分布
设
X
1
,
X
2
.
.
.
X
n
X_1,X_2...X_n
X1,X2...Xn是n个相互独立的随机变量,它们的分布函数分别为
F
X
i
(
x
i
)
(
i
=
1
,
2...
n
)
F_{Xi}(x_i)(i=1,2...n)
FXi(xi)(i=1,2...n),则M=max{X,Y}及N=min{X,Y}的分布函数为:
F
m
a
x
(
z
)
=
F
X
1
(
z
)
F
X
2
(
z
)
.
.
.
F
X
n
(
z
)
F
m
i
n
=
(
z
)
=
1
−
[
1
−
F
X
1
(
z
)
]
[
1
−
F
X
2
(
z
)
]
.
.
.
[
1
−
F
X
n
(
z
)
]
F_{max}(z)=F_{X_1}(z)F_{X_2}(z)...F_{X_n}(z)\\ F_{min=}(z)=1-[1-F_{X_1(z)}][1-F_{X_2(z)}]...[1-F_{X_n(z)}]
Fmax(z)=FX1(z)FX2(z)...FXn(z)Fmin=(z)=1−[1−FX1(z)][1−FX2(z)]...[1−FXn(z)]
当
X
1
,
X
2
.
.
.
X
n
X_1,X_2...X_n
X1,X2...Xn相互独立且具有相同的分布函数F(x)时:
F
m
a
x
(
z
)
=
[
F
(
z
)
]
n
F
m
i
n
(
z
)
=
1
−
[
1
−
F
(
z
)
]
n
F_{max}(z)=[F(z)]^n\\ F_{min}(z)=1-[1-F(z)]^n
Fmax(z)=[F(z)]nFmin(z)=1−[1−F(z)]n
四、随机变量的数字特征
1.数学期望
离散型随机变量的数学期望
定义:设离散型随机变量X的分布列P(X=x)=
p
i
(
i
=
1
,
2...
)
若
级
数
∑
i
=
1
∞
x
i
p
i
p_i(i=1,2...)\\ 若级数\sum_{i=1}^\infty x_ip_i
pi(i=1,2...)若级数∑i=1∞xipi绝对收敛,即
∑
i
=
1
∞
∣
x
i
∣
p
i
<
∞
,
则
称
∑
i
=
1
∞
x
i
p
i
为
X
的
数
学
期
望
记
为
E
(
X
)
\sum_{i=1}^\infty|x_i|p_i<\infty ,则称\sum_{i=1}^\infty x_ip_i为X的数学期望\\记为E(X)
∑i=1∞∣xi∣pi<∞,则称∑i=1∞xipi为X的数学期望记为E(X)
常用离散分布的期望
X~B(1,p),则E(X)=p
X~B(n,p),则E(X)=np
X~P(
λ
\lambda
λ),则E(X)=
λ
\lambda
λ
X~G( p),则E(X)=1/p
连续型随机变量的数学期望
定义:设X是连续型随机变量,其密度函数为
f
(
x
)
f(x)
f(x),若
∫
−
∞
∞
x
f
(
x
)
d
x
\int_{-\infty}^\infty xf(x)dx
∫−∞∞xf(x)dx绝对收敛,则称:
∫
−
∞
∞
x
f
(
x
)
d
x
\int_{-\infty}^\infty xf(x)dx
∫−∞∞xf(x)dx为X的数学期望。
常用连续分布的期望
均匀分布:X~U(a,b),E(X)=
a
+
b
2
\frac{a+b}{2}
2a+b
指数分布:X~E(
λ
\lambda
λ),E(X)=
1
λ
\frac{1}{\lambda}
λ1
正态分布:X~N(
μ
,
σ
2
\mu,\sigma^2
μ,σ2),E(X)=
μ
\mu
μ
一维随机变量函数的数学期望
定理1:设Y=g(X),g(x)是连续函数
(1) 若X是离散型随机变量,其分布P(X=
x
i
x_i
xi)=
p
i
p_i
pi且
∑
i
=
1
∞
∣
g
(
x
i
)
p
i
<
∞
∣
\sum_{i=1}^\infty|g(x_i)p_i<\infty|
∑i=1∞∣g(xi)pi<∞∣则:
E
(
Y
)
=
E
∣
g
(
X
)
∣
=
∑
i
=
1
∞
g
(
x
i
)
p
i
E(Y)=E | g(X)|=\sum_{i=1}^\infty g(x_i)p_i
E(Y)=E∣g(X)∣=∑i=1∞g(xi)pi
(2) 若X是连续型随机变量,其概率密度为
f
(
x
)
f(x)
f(x)则:
E
(
Y
)
=
E
∣
g
(
X
)
∣
=
∫
−
∞
∞
g
(
x
)
f
x
(
x
)
d
x
E(Y)=E|g(X)|=\int_{-\infty}^\infty g(x)f_x(x)dx
E(Y)=E∣g(X)∣=∫−∞∞g(x)fx(x)dx
二维随机变量函数的数学期望
定理2:设Z=g(X,Y),G(x,y)为连续函数
(1)若(X,Y)是二维离散型随机变量,其分布列P(X=
x
i
x_i
xi,Y=
x
j
x_j
xj)=
p
i
j
p_{ij}
pij则:
E
(
Z
)
=
E
∣
g
(
X
,
Y
)
∣
=
∑
i
=
1
∞
∑
j
=
1
∞
g
(
x
i
,
y
j
)
p
i
j
E(Z)=E|g(X,Y)|=\sum_{i=1}^\infty\sum_{j=1}^\infty g(x_i,y_j)p_{ij}
E(Z)=E∣g(X,Y)∣=∑i=1∞∑j=1∞g(xi,yj)pij
(2)若(X,Y)是二维连续型随机变量,其概率密为
f
(
x
,
y
)
f(x,y)
f(x,y)则:
E
(
Z
)
=
E
∣
g
(
X
,
Y
)
∣
=
∫
−
∞
∞
∫
−
∞
∞
g
(
x
,
y
)
f
(
x
,
y
)
d
x
d
y
E
(
X
)
=
∫
−
∞
∞
∫
−
∞
∞
x
f
(
x
,
y
)
d
x
d
y
E
(
Y
)
=
∫
−
∞
∞
∫
−
∞
∞
y
f
(
x
,
y
)
d
x
d
y
E(Z)=E|g(X,Y)|=\int_{-\infty}^\infty\int_{-\infty}^\infty g(x,y)f(x,y)dxdy\\ E(X)=\int_{-\infty}^\infty\int_{-\infty}^\infty xf(x,y)dxdy\\ E(Y)=\int_{-\infty}^\infty\int_{-\infty}^\infty yf(x,y)dxdy
E(Z)=E∣g(X,Y)∣=∫−∞∞∫−∞∞g(x,y)f(x,y)dxdyE(X)=∫−∞∞∫−∞∞xf(x,y)dxdyE(Y)=∫−∞∞∫−∞∞yf(x,y)dxdy
数学期望的性质
- 设C是常数,则E©=C
- E(CX)=XE(X),C是常数
- E ( X 1 + X 2 ) = E ( X 1 ) + E ( X 2 ) 推 广 : E ∣ ∑ i = 1 ∞ X i ∣ = ∑ i = 1 ∞ E ( X i ) E(X_1+X_2)=E(X_1)+E(X_2)\\推广:E|\sum_{i=1}^\infty X_i|=\sum_{i=1}^\infty E(X_i) E(X1+X2)=E(X1)+E(X2)推广:E∣∑i=1∞Xi∣=∑i=1∞E(Xi)
- 设 X 1 X_1 X1与 X 2 X_2 X2独立,则 E ( X 1 X 2 ) = E ( X 1 ) E ( X 2 ) 推 广 : E ∣ ∏ i = 1 n X i ∣ = ∏ i = 1 n E ( X i ) E(X_1X_2)=E(X_1)E(X_2)\\推广:E|\prod_{i=1}^nX_i|=\prod_{i=1}^nE(X_i) E(X1X2)=E(X1)E(X2)推广:E∣∏i=1nXi∣=∏i=1nE(Xi)
2.方差
定义:设X是一个随机变量,若E|X-E(X)|
2
^2
2存在,则E|X-E(X)|
2
^2
2是X的方差,记作D(X),即:
D(X)=E|X-E(X)|
2
^2
2
D
(
X
)
\sqrt{D(X)}
D(X)是X的标准差或均方差,记
σ
x
\sigma_x
σx
D
(
X
)
=
E
(
X
2
)
−
[
E
(
X
)
]
2
D(X)=E(X^2)-[E(X)]^2
D(X)=E(X2)−[E(X)]2
常用分布的方差
泊松分布:X~P(
λ
\lambda
λ),D(X)=
λ
\lambda
λ
均匀分布:X~U(a,b),D(X)=
(
b
−
a
)
2
12
\frac{(b-a)^2}{12}
12(b−a)2
正态分布:X~N(
μ
\mu
μ,
σ
2
\sigma^2
σ2),D(X)=
σ
2
\sigma^2
σ2
二项分布:X~B(n,p),D(X)=np(1-p)
几何分布:X~G§,D(X)=
1
−
p
p
2
\frac{1-p}{p^2}
p21−p
指数分布:X~E(
λ
\lambda
λ)=
1
λ
2
\frac{1}{\lambda^2}
λ21
方差的性质
- 设C是常数,则D( C)=0
- 若C是常数,则D(CX)= C 2 D ( X ) C^2D(X) C2D(X)
- D(X+Y)=D(X)+D(Y)+2E{|X-E(X)||Y-E(Y)|} 若 X Y 相 互 独 立 , 则 : D ( X + Y ) = D ( X + D ( Y ) 推 广 : X 1 , X 2 . . . X n 相 互 独 立 , 则 : D ∣ ∑ i = 1 n X i ∣ = ∑ i = 1 n D ( X i ) D ∣ C 0 + ∑ i = 1 n C i X i ∣ = ∑ i = 1 n C i 2 D ( X i ) \\若XY相互独立,则:D(X+Y)=D(X+D(Y)\\推广:X_1,X_2...X_n相互独立,则:\\D|\sum_{i=1}^nX_i|=\sum_{i=1}^nD(X_i)\\D|C_0+\sum_{i=1}^nC_iX_i|=\sum_{i=1}^nC_i^2D(X_i) 若XY相互独立,则:D(X+Y)=D(X+D(Y)推广:X1,X2...Xn相互独立,则:D∣∑i=1nXi∣=∑i=1nD(Xi)D∣C0+∑i=1nCiXi∣=∑i=1nCi2D(Xi)
- 若X.Y独立,则: D ( X Y ) = D ( X ) D ( Y ) + D ( X ) ∣ E ( Y ) ∣ 2 + D ( Y ) ∣ E ( X ) ∣ 2 \\D(XY)=D(X)D(Y)+D(X)|E(Y)|^2+D(Y)|E(X)|^2 D(XY)=D(X)D(Y)+D(X)∣E(Y)∣2+D(Y)∣E(X)∣2
- D(X)=0的充要条件是X以概率1取常数,即: p { X = E ( X ) } = 1 \\p\{X=E(X)\}=1 p{X=E(X)}=1
3.协方差及相关系数
协方差定义: 若E{|X-E(X)||Y-E(Y)|}存在,称它为随机变量X和Y的协方差,记Cov(X,Y)
当Cov(X,Y)>0,X与Y正相关
当Cov(X,Y)<0,X与Y负相关
当Cov(X,Y)=0,X与Y不相关
协方差的性质
- Cov(X,Y)=Cov(Y,X),Cov(X,a)=0,a为常数
- D(X)=Cov(X,X)
- Cov(aY,bX)=abCov(Y,X)
- C o v ( X 1 + X 2 , Y ) = C o v ( X 1 , Y ) + C o v ( X 2 , Y ) 协 方 差 的 计 算 公 式 : C o v ( X , Y ) = E ( X Y ) − E ( X ) E ( Y ) Cov(X_1+X_2,Y)=Cov(X_1,Y)+Cov(X_2,Y)\\协方差的计算公式:Cov(X,Y)=E(XY)-E(X)E(Y) Cov(X1+X2,Y)=Cov(X1,Y)+Cov(X2,Y)协方差的计算公式:Cov(X,Y)=E(XY)−E(X)E(Y)
- 若X与Y独立,则Cov(X,Y)=0
相关系数的定义: 若
C
o
v
(
X
,
Y
)
Cov(X,Y)
Cov(X,Y)存在,且D(X)>0,D(Y)>0,称:
ρ
x
y
=
C
o
v
(
X
,
Y
)
D
(
X
)
D
(
Y
)
\rho_{xy}=\frac{Cov(X,Y)}{\sqrt{D(X)D(Y)}}
ρxy=D(X)D(Y)Cov(X,Y)为随机变量X,Y的相关系数。
相关系数是表示两个随机变量之间线性相关程度的一个数字特征(无量纲),相关系数越接近1,两个变量的线性相关程度越高,相关系数越接近0,两个变量的线性相关程度越低。
协方差也是表示两个随机变量之间的线性相关程度的一个数字特征(有量纲)
4.矩、协方差矩阵
定义:
(1)若
E
(
X
k
)
(
K
=
1
,
2...
)
E(X^k)(K=1,2...)
E(Xk)(K=1,2...)存在,则称E(
X
k
X^k
Xk)为X的k阶原点矩,记:
a
k
=
E
(
X
k
)
a_k=E(X^k)
ak=E(Xk)
(2)若
E
[
X
−
E
(
X
)
]
k
E[X-E(X)]^k
E[X−E(X)]k存在,则称
E
[
X
−
E
(
X
)
]
k
E[X-E(X)]^k
E[X−E(X)]k为X的k阶中心矩,记:
β
k
=
E
[
X
−
E
(
X
)
]
k
\beta_k=E[X-E(X)]^k
βk=E[X−E(X)]k
** E(X)为1阶原点矩;D(X)为2阶中心矩
(3)若
E
(
X
k
Y
l
)
(
k
,
l
=
1
,
2...
)
E(X^kY^l)(k,l=1,2...)
E(XkYl)(k,l=1,2...)存在,则称
E
(
X
k
Y
l
)
E(X^kY^l)
E(XkYl)为X和Y的k+l阶混合原点矩,记:
a
k
,
l
=
E
(
X
k
Y
l
)
a_{k,l}=E(X^kY^l)
ak,l=E(XkYl)
(4)若
E
[
X
−
E
(
X
)
]
k
[
Y
−
E
(
Y
)
l
]
E[X-E(X)]^k[Y-E(Y)^l]
E[X−E(X)]k[Y−E(Y)l]存在,则称
E
[
X
−
E
(
X
)
]
k
[
Y
−
E
(
Y
)
l
]
E[X-E(X)]^k[Y-E(Y)^l]
E[X−E(X)]k[Y−E(Y)l]为X和Y的k+l阶混合中心矩,记:
β
k
,
l
=
E
[
X
−
E
(
X
)
]
k
[
Y
−
E
(
Y
)
l
]
\beta_{k,l}=E[X-E(X)]^k[Y-E(Y)^l]
βk,l=E[X−E(X)]k[Y−E(Y)l]
**协方差为1+1阶混合中心矩
五、大数定律及中心极限定理
1.大数定律
依概率收敛
定义: 设 Z 1 , Z 2 . . . Z_1,Z_2... Z1,Z2...是一个随机变量序列,a是一个常数,若对任意 ϵ > 0 \epsilon>0 ϵ>0有: l i m n → ∞ P ( ∣ Z n − a ∣ < ϵ ) = 1 lim_{n\to\infty}P(|Z_n-a|<\epsilon)=1 limn→∞P(∣Zn−a∣<ϵ)=1,称序列依概率收敛于a
切比雪夫不等式
对任意随机变量X,若D(X)存在,则对任意的
ϵ
>
0
\epsilon>0
ϵ>0有:
P
[
∣
X
=
E
(
X
)
∣
≥
ϵ
]
≤
D
(
X
)
ϵ
2
或
:
P
[
∣
X
=
E
(
X
)
∣
<
ϵ
]
≥
1
−
D
(
X
)
ϵ
2
P[|X=E(X)|\geq\epsilon]\leq\frac{D(X)}{\epsilon^2}\\或:P[|X=E(X)|<\epsilon]\geq1-\frac{D(X)}{\epsilon^2}
P[∣X=E(X)∣≥ϵ]≤ϵ2D(X)或:P[∣X=E(X)∣<ϵ]≥1−ϵ2D(X)
伯努利大数定律
设
Y
n
Y_n
Yn是n重伯努利试验中事件A发生的次数,
p
(
0
<
p
<
1
)
p(0<p<1)
p(0<p<1)是事件A发生的概率,则对任给的
ϵ
>
0
\epsilon>0
ϵ>0,有:
l
i
m
n
→
∞
P
{
∣
Y
n
n
−
p
∣
≥
ϵ
}
=
0
或
:
l
i
m
n
→
∞
P
{
∣
Y
n
n
−
p
∣
<
ϵ
}
=
1
lim_{n\to\infty}P\{|\frac{Y_n}{n}-p|\geq\epsilon\}=0\\ 或:lim_{n\to\infty}P\{|\frac{Y_n}{n}-p|<\epsilon\}=1
limn→∞P{∣nYn−p∣≥ϵ}=0或:limn→∞P{∣nYn−p∣<ϵ}=1
切比雪夫大数定律
设
X
1
,
X
2
.
.
.
X_1,X_2...
X1,X2...是相互独立的随机变量序列,他们都有有限的方差,且方差有共同的上界,即
D
(
X
i
)
≤
C
D(X_i)\leq C
D(Xi)≤C,则对任意的
ϵ
>
0
\epsilon>0
ϵ>0,有:
l
i
m
n
→
∞
P
{
∣
1
n
∑
i
=
1
n
X
i
−
1
n
∑
i
=
1
n
(
E
X
i
)
∣
≥
ϵ
}
=
0
或
:
l
i
m
n
→
∞
P
{
∣
1
n
∑
i
=
1
n
X
i
−
1
n
∑
i
=
1
n
(
E
X
i
)
∣
<
ϵ
}
=
1
lim_{n\to\infty}P\{|\frac{1}{n}\sum_{i=1}^nX_i-\frac{1}{n}\sum_{i=1}^n(EX_i)|\geq\epsilon\}=0\\ 或:lim_{n\to\infty}P\{|\frac{1}{n}\sum_{i=1}^nX_i-\frac{1}{n}\sum_{i=1}^n(EX_i)|<\epsilon\}=1
limn→∞P{∣n1∑i=1nXi−n1∑i=1n(EXi)∣≥ϵ}=0或:limn→∞P{∣n1∑i=1nXi−n1∑i=1n(EXi)∣<ϵ}=1
2.中心极限定理
独立同分布下的中心极限定理(林德伯格-莱维定理)
设
X
1
,
X
2
,
.
.
.
X_1,X_2,...
X1,X2,...是独立同分布的随机变量序列,且
E
(
X
i
)
=
μ
,
D
(
X
i
)
=
σ
2
E(X_i)=\mu,D(X_i)=\sigma^2
E(Xi)=μ,D(Xi)=σ2,则对充分大的n,有:
∑
i
=
1
n
X
i
≈
B
(
n
μ
,
n
σ
2
)
\sum_{i=1}^nX_i\approx B(n\mu,n\sigma^2)
∑i=1nXi≈B(nμ,nσ2)
P
(
a
<
∑
i
=
1
n
≤
b
)
≈
ϕ
(
b
−
n
μ
n
σ
)
−
ϕ
(
a
−
n
μ
n
σ
)
P(a<\sum^n_{i=1}\leq b)\approx\phi(\frac{b-n\mu}{\sqrt{n}\sigma})-\phi(\frac{a-n\mu}{\sqrt{n}\sigma})
P(a<∑i=1n≤b)≈ϕ(nσb−nμ)−ϕ(nσa−nμ)
棣莫佛-拉普拉斯定理
设随机变量
Y
n
Y_n
Yn服从参数n,p的二项分布,则对充分大的n,有:
Y
n
≈
N
(
n
p
,
n
p
q
)
即
:
P
(
a
<
Y
n
≤
q
)
≈
ϕ
(
b
−
n
μ
n
p
q
)
−
ϕ
(
a
−
n
μ
n
p
q
)
Y_n\approx N(np,npq)\\即:P(a<Y_n\leq q)\approx\phi(\frac{b-n\mu}{\sqrt{npq}})-\phi(\frac{a-n\mu}{\sqrt{npq}})
Yn≈N(np,npq)即:P(a<Yn≤q)≈ϕ(npqb−nμ)−ϕ(npqa−nμ)
**在实际中,0.1<p<0.9,npq>9时,用正态近似;当
p
≤
0.1
(
或
p
≥
0.9
)
且
n
≥
10
时
,
用
泊
松
近
似
。
p\leq0.1(或p\geq0.9)且n\geq10时,用泊松近似。
p≤0.1(或p≥0.9)且n≥10时,用泊松近似。