概率知识回顾
Table of Contents
1 随机变量及其分布
- 随机变量(random variable)
- 定义: 定义在概率空间 (Ω,F,P) 上, 取值为实数的函数, 常用大写 字母 X,Y,Z 表示
- 分类: 离散型随机变量和 连续性随机变量
- 离散型rv: 取值为有限或可数值的随机变量
- 连续性rv: 连续取值的随机变量(分布函数可以表示为不定积分形式)
- 随机变量的分布函数
- 定义 : F(x)=P(X≤x)
- 性质:
- 单调增
- 有界: 0≤F(x)≤1
- 右连续 F(x+)=F(x)
- 离散型随机变量
- (0,1) 分布 \(P(X=1)=p,P(0)=1-p,0<p<1\) <="" li="">
- 二项分布 P(X=k)=(nk)pk(1−p)n−k,k=0,⋯,n
- 泊松分布
P(X=k)=λkk!e−λ,k=0,⋯
- 产生随机数
- 产生(0,1) 分布,二项分布,泊松分布的随机数
rbinom(20,1,0.4) ## 产生20个取值为 (0,1),概率为0.6,0.4 的随机数 rbinom(20,8,0.2) ## 产生20个 b(8,0.2) 的随机数 rpois(20,0.4) ## 产生 20个 Pi(0.4) 的随机数
[1] 0 1 0 1 0 1 1 0 0 0 1 0 0 1 1 1 0 0 0 1 [1] 3 1 3 3 2 1 4 3 1 1 1 0 3 1 2 0 1 3 2 1 [1] 0 0 1 1 1 1 0 1 1 1 0 0 1 0 0 0 1 0 1 0
- 连续性随机变量
- 均匀分布:
f(x)=1b−aI(b>x>a)
- 指数分布
f(x)=1θe−xθI(x>0)
- 正态分布
N(μ,σ2)
f(x)=12π−−√σexp(−(x−μ)22σ2)
- 均匀分布:
- 统计分析中常用三大分布
- 卡方分布: χ2 : 设 X1,⋯,Xp 为 独立同分布的 N(0,1) 随机变量, 称 χ2=∑i=1pX2i 服从自由度为 p 的 χ2 分布
- t 分布: 设 X∼N(0,1) , Y∼χ2(n) , X 与 Y 相互独立, 则称 t=XYn√ 服从自由度为 n 的 student 分布, 记为 t∼t(n)
- F分布:设 X∼χ2(m) , Y∼χ2(n) , X 与 Y 相互独立, 则称 F=X/mY/n 服从自由度为 (m,n) 的F分布 , 记为 F∼F(m,n) ,
- 若 t∼t(n) 则 t2∼F(1,n)
2 随机变量的数字特征
- 期望–Expectation–随机变量的位置特征
- 定义
- 离散型 E(X)=∑i=1∞xiP(X=xi)
- 连续性 E(X)=∫−∞∞f(x)dx
- 上述定义成立的条件是 上述级数绝对可和,上述积分绝对可积
- 性质: 期望具有线性性质 E(aX+bY+c)=aEX+bEY+c
- 定义
- 方差–Variance–随机变量的离散程度
- 常记为 Var 或 D
- 定义 Var(X)=E[(X−EX)2]
- 计算公式 Var(X)=E(X2)−(EX)2
- 性质:
- Var(aX)=a2Var(X)
- 若 X,Y 相互独立, 则有 Var(X+Y)=Var(X)+Var(Y)
- 协方差相关系数
- 协方差
Cov(X,Y)=E[(X−EX)(Y−EY)]
- 协方差性质 X 与 Y 独立时, 有 Cov(X,Y)=0
-相关系数 ρ(X,Y)=Cov(X,Y)D(X)D(Y)√
- 相关系数性质:
- |ρ(X,Y)≤1|
- |ρ(X,Y)|=1 , 当且仅当 X,Y 之间有严格的线性关系
- 协方差
- 常见分布的期望方差
- (0,1) 分布: E(X)=p,D(X)=p(1−p)
- b(n,p) 分布: E(X)=np,D(X)=np(1−p)
- π(λ) 分布: E(X)=λ,D(X)=λ
- U(a,b) 分布: E(X)=a+b2,D(X)=(b−a)2/12
- exp(θ) 分布: E(X)=θ,D(X)=θ2
- N(μ,σ2θ) 分布: E(X)=μ,D(X)=σ2
Date: 2013-11-19