计算机视觉一些算法中常会用到概论的一些知识,为了便于理解和快速回忆,博主这边对常用的一些知识点做下整理,主要来源于如下这本书籍。
1. 随机试验的每一可能结果称为一个基本事件,一个或一组基本事件统称随机事件,或简称事件。典型的随机试验有掷骰子、扔硬币、抽扑克牌以及轮盘游戏等。
2.事件的概率是衡量该事件发生的可能性的量度。
3.随机事件,是指的一个事件,一件事情,如一次实验,要求是其结果是随机的,可以有很多种,如掷骰子有六种结果,但投之前是不可以确定的.而随机变量用来表示随机事件的一种结果或几种结果的集合,如A表示投掷的结果是1,B表示投掷的结果为1或2,等等,总之,随机变量是结果的集合的子集,包括全集。可看到具体的随机事件是随机变量的一个子集,一种具体情况
4.对于一个随机变量,不仅要说明它能够取什么值,更需要关心取这些值的概率(分布函数)。
5.多个随机变量之间的关系
6. 如果随机变量 X的全部可能取值只有有限多个或可列无穷多个,则称 X 为离散型随机变量。掷骰子的结果就是离散型随机变量。
6.期望值不是求概率值,而是去看随机变量的取值
如果随机变量可取任意的整数值,期望值就不一定存在。此外对于赌博来说,期望值也不是越多越好。例如,对于有1/2的概率获得10亿元与直接获得1亿元,你会如何选择呢?显然,前者的期望值为5亿元,后者为1亿元。
7.方差即期望值的离散程度
8. 随机变量的平均值
之前提过,离散变量取一值时就是一个事件;联合分布的几个变量,各取一值时,也就是一个事件。联合分布可以是某个动作在重复做的事件,大数定律描述的也是一个事件,这个事件由重复的某一个动作构成。如上文提到的那样,X1,X2,...Xn随机变量的平均值Z。随着n的增大,Z的方差为0,此时z的期望值即接近为统计出来的平均值。
9. 条件期望与最小二乘法
10.连续值的概率分布一些知识点可以类比离散情况。这里有个概率密度函数的概念
注意一点连续随机变量取一值的概率为0
对于取值某一段的概率才有意义
变量的变换函数
如下是离散分布和连续分布公式的对比
如下连续型随机变量的期望值,方差和标准差
如下是连续随机变量的联合分布概率
标准正态分布和一般正态分布
联合分布变量的求解
中心极限定理如下
11.协方差和相关系数
12. 协方差矩阵
协方差矩阵重点是要明白意思,可以表示一个向量各分量之间的关系。比如我们常接触到的样本集,一般会如下表示:
一列可以表示一个样本中提取出的特征向量,然后这组集合里有n个样本。我们可以认为每列特征向量都是一个联合分布变量的实际取值。所以可以去计算V[X],V[Y],Con(X,Y)等。比如利用第一行和第二行可以得到Con(X,Y) 。那么协方差矩阵就可以通过一个样本集合计算出来,来表示这个样本集合的一些特性。
如下即是计算一些样本集特性的例子,这里样本集是一个二维空间中点的集合。
通过协方差矩阵可以计算出这些点集的主轴。 可以看到,矩阵论的一些知识点就和概率论交叉在了一起。因为矩阵论都是基于矩阵的数学计算,然后矩阵中的列可以看作是随机变量的一个取值。对于这一点关联点还是挺有意思的。后面博主也会有篇幅来介绍矩阵论的相关知识。
13.估计与检验
估计是利用现有的样本来估计变量的一些特性值,如期望和方差
检验理论中的显著性水平知识也常会碰到,其也可以变相的去验证哪个联合分布事件的概率大。
14.概率论的应用
(1) 通过最小二乘法拟合直线
(2)主成分分析
卡尔曼滤波和马尔科夫链后面有时间以专篇来介绍吧。 暂时就记录这些吧。