一、备注
最近在学习机器学习,需要用到很多数学知识,加上要准备夏令营,于是找了一份浙大的概率论资料,将其中一些知识总结下来,供日后复习之用。
我感觉概率统计的一个非常大的特点就是用频率估计概率,在统计的过程中还会用到很多采样的方法,比如MCMC采样,拒绝采样等,对于一些难以直接采样的问题,还会用到一些技巧,这里又设计到随机过程的知识。这里我想总结一下关于概率论里面的一些基本的定理,补充一下基础知识。
定义:设、
、......、
、.....为一个随机变量序列,c为一常数,若对于
均有:
成立,则称随机变量序列依概率收敛于c,
记为: 当
.
二、辛钦大数定理
形式比较简单,但是证明很麻烦。
定义:、
.... 、
、....为独立同分布的随机变量,且其期望存在,为
, 那么,
,当
三、马尔可夫不等式
定理:对于, 具有数学期望
, 那么对于任意
, 有
证明:
1.对于离散型变量
2.对于连续型变量
四、切比雪夫定理(不等式)
1.切比雪夫不等式
定义:
证明:
再利用马尔可夫不等式,得
2.切比雪夫大数定理
定义:、
、....、
、.... 为相互独立的随机变量,且具有相同的期望
,相同的方差
,
那么, 当
.
证明:记,则
,
.
对应用切比雪夫不等式,得
,当
.
五、中心极限定理(万物归一)
1.独立同分布的中心极限定理(CLT)
定义:设随机变量、
、....,
,....相互独立且同分布,
,
,则对于充分大的n,有
2.棣莫弗-拉普拉斯中心极限定理
定义:记为n重伯努利试验中事件A发生的次数,并记事件A在每次试验中发生的概率为p(0<p<1)
则对于充分大的n有.
即对于二项分布, 当n充分大时,可用正态分布来近似。