开始第一部分概率的学习,这里着重于体现计算机视觉中应用的概率基础。
为什么概率是适合描述计算机视觉问题的语言?
1.我们观察到的是进入传感器(相机等图像采集设备)光线量总量的噪声估计。2.现实世界与测量参数是多对一的关系,每一个世界的存在可能性都可以表示为概率(多视图确定一个测量目标,每一个视图的测量结果(根据其角度)都有不同的权重)
离散变量的概率分布表示:直方图和hinton图
连续变量的概率分布表示:PDF(概率密度函数)
联合概率分布:
边缘概率:
条件概率
独立性:
贝叶斯公式:
后验概率*证据 = 似然概率*先验概率
似然概率pr(x|y)表示x与y的关系,若感兴趣的是变量y,则用贝叶斯公式计算pr(y|x)【给定x下y的概率】
常用概率分布与计算机视觉:
使用概率分布可以描述全局状态和图像数据。
伯努利分布:描述的状况{0,1},用于模拟数据,例如:描述一个像素所取得灰度值大于或小于128的概率。
模拟现实世界的状态,例如:描述图像中人脸出现或者消失的概率。
贝塔分布:适合表示伯努利分布中参数的不确定性。
---------------------------------------------------------------------------------------------------------------------------------------------------------
分类分布:k个可能结果的离散分布,描述一个像素的亮度数值(量化的,离散的)
描述真实世界状态的不确定性,例如:车辆的分类:小汽车、公交车、面包车。
狄利克雷分布:适合表示分类分布中参数的分布。
-------------------------------------------------------------------------------------------------------------------------------------------------------------------------
一元正态分布(高斯分布)x是一个连续值 [负无穷,正无穷] ,忽略像素的灰度值是量化的,用连续正态分布对其建模。
表示到一个物体的距离。
正态逆伽玛分布:定义正态分布中参数方差和均值的分布。
-------------------------------------------------------------------------------------------------------------------------------------------------------------------------
多元正态分布:由D维变量x决定的模型。图像一个区域内的亮度联合起来建立的正态分布模型,全局状态中某个物体的三维坐标。
正态逆维希特分布:描述多元正态分布中参数的概率分布。
-------------------------------------------------------------------------------------------------------------------------------------------------------------------------
伯努利分布、分类分布、 一元正态分布、多元正态分布
贝塔分布、狄利克雷分布、正态道伽马分布、正态逆维希特分布
下一组用于描述上一组分布的参数的概举分布,因此它们可以描述拟合模型的不确定性。
第二组中的每个分布是对应的第一组的共轭。共轭关系可以更容易地拟合观测数据并在拟合分布模型下评估新的数据 。
拟合概率模型:
评估预测分布三个方法:最大似然法ML、最大后验法MAP和贝叶斯方法。
学习:拟合时需要[学习]模型的参数θ
ML:估算在xi处的概率密度函数,并作乘积,求最大参数θ
MAP:估计最大化参数的后验概率Pr(θ|x1……I) ML是MAP在先验信息未知情况下的一个特例。
贝叶斯方法:参数θ可能有多个与数据兼容的值。使用积分作为由不同参数确定的预测的加权和(由参数的后验概率分布决定)
将三者统一起来计算:简单估算数据在估计参数模型下的概率。
一元正态分布的例子:
用最小二乘拟合等价于用最大似然方法拟合一个正态分布的均值参数。