概率论对于学习 NLP 方向的人,重要性不言而喻。于是我打算从概率论基础篇开始复习,也顺便巩固巩固基础。
这是基础篇的第六篇知识点总结
注意:复杂的公式例如卷积公式等将在概率论高阶中提到
基础:下面前五篇的链接地址:
概率论基础(1)古典和几何概型及事件运算
概率论基础(2)条件概率、全概率公式和贝叶斯公式
概率论基础(3)一维随机变量(离散型和连续型)
概率论基础(4)五种重要的分布(二项、泊松、均匀、指数、正态分布)
概率论基础(5)离散型二维随机变量
连续型二维随机变量
知识点
- 概率密度
- 边缘概率密度
- 条件概率密度
- 独立性
- 需要有二重积分相关知识
定义可自行查询
常用性质:
根据前面几节的回顾,加上了解其定义,不难理解有以下性质:
例题
理解:在这里用到了第一个公式性质,运用二重积分的计算,可直接求出 c 的值为4。求出 c 后,要求解P(X+Y<1)重点是分析D的取值范围,如果较为熟悉二重积分,很快就能确定其范围
理解:求x的边缘概率密度,其实就是对y进行求偏微分,反之亦然。
注意:写概率密度的形式,一般是大括号,然后标清区间的位置,其他为0.
理解:注意条件概率密度的计算公式即可,根据前面求的,直接代入。
理解:根据最后一条性质,根据其式子直接判断即可。
注意:它的区间不再是简单的孤立,而是相互关联起来。
仿照上述题目,即可解决问题:
注意:当从x的范围到y不好分析时,可以利用y来求解x的范围,注意一下求解技巧。
理解:与上题1类似。
理解:可以直接利用第二问求解的值,来判断。
放一点额外的练习题,来巩固基础
连续型二维随机变量函数的分布
知识点
- Z = X + Y 分布
- Z = XY 分布
- Z = max{X, Y} 分布
Z = X + Y 分布
它有一个常用的解题步骤
具体选择哪一种的依据:
注意:可以画图来分析Z在坐标轴上的分布情况,从而分类处理
最终结果:
Z = XY 分布
这种分布也有常用的解题方法步骤:
理解:需要注意的是,当z <= 0 时,由于z的范围是0 < z < x ,因此它是没有意义的,所以取0
Z = man{X, Y}的分布
它的常用解题步骤:
例题
理解:先用公式解出z的分布函数,其概率密度就是其分布函数的求导结果
这里给两个常用的结论:
额外放一点练习题: