计算机视觉-模型学习和推理笔记第六章_《计算机视觉:模型、学习和推理》第六章视觉学习和推理-CSDN博客

本文链接：https://blog.csdn.net/u012009684/article/details/112384223

《Computer Vision - Model Learning and Inference》笔记

第六章

计算机视觉的问题是根据视觉数据 $\bold{x}$ 推测现实状态 $\bold{w}$ 的过程

模型分为两种

根据视觉数据求现实状态概率分布 $Pr(\bold{w}|\bold{x})$ 的判别模型。
根据现实状态求视觉数据概率分布 $Pr(\bold{x}|\bold{w})$ 的生成模型。

示例1：假设 $w$ 和 $x$ 是连续的标量

判别模型：

我们设正态分布函数 $Pr(w|x,\bm{\theta})=Norm_w[\mu,\sigma^2]$ 。其中，参数 $\mu$ 为均值， $\sigma^2$ 为方差。它们决定了函数的形状，代入自变量 $w$ 即可求得 $w$ 处的概率密度。

若假定均值 $\mu$ 和 $x$ 成线性关系 $\mu=\phi_0+\phi_1x$ ，则 $Pr(w|x,\bm{\theta})=Norm_w[\phi_0+\phi_1x,\sigma^2]$ ，这种方法称为线性回归。那么模型的参数集 $\bm{\theta}=\{\phi_0,\phi_1,\sigma^2\}$ ，学习算法的任务就是利用数据集 $\{x_i,w_i\}^I_{i=1}$ 进行拟合，求 $\bm{\theta}$ 。求好之后推理算法的任务很简单，就是把新数据 $x$ 代入，求得 $w$ 的概率分布。

判别模型

判别模型的图像，颜色深度代表 $P r (w ∣ x)$ 的大小

生成模型：

生成模型正好相反，若仍采用正态分布+线性回归，则设 $Pr(x|w,\bm{\theta})=Norm_x[\phi_0+\phi_1w,\sigma^2]$ 。同理用数据拟合求得 $\bm{\theta}=\{\phi_0,\phi_1,\sigma^2\}$ 。

假设 $w$ 也满足正态分布， $Pr(w)=Norm_w[\mu_p,\sigma_p^2]$ ，用数据 $\{w_i\}^I_{i=1}$ 求出 $\bm{\theta_p}=\{\mu_p,\sigma_p^2\}$ 。

求好后，推理算法用贝叶斯定理求新数据 $x$ 对应 $w$ 的概率分布：
$Pr(w|x)=\frac{Pr(x|w)Pr(w)}{Pr(x)}$

示例2：假设 $x$ 是连续标量， $w$ 是离散标量

判别模型：

因为 $w$ 只能取0或1，我们可以使用伯努利分布。它的唯一参数 $\lambda$ 表示 $w$ 取1的概率。 $Pr(w=1)=\lambda$ 。

同示例1，我们设 $\lambda=f(x)$ 。由于概率 $\lambda\in[0,1]$ ，我们先把x输入线性函数（结果属于R），再把结果给到sigmoid函数（结果在0和1之间）：
$\lambda=Bern_w[sig[\phi_0+\phi_1x]]=Bern_w[\frac{1}{1+exp[-\phi_0-\phi_1x]} ]]$
这个操作称为逻辑回归。

这个模型的参数集合 $\bm{\theta}=\{\phi_0,\phi_1\}$

生成模型：
不多解释。
$Pr(w|,\bm{\theta})=Norm_x[\mu_w,\sigma_w^2]$
由于 $w$ 只有2个值，可以直接写成：
$Pr(w=0|,\bm{\theta})=Norm_x[\mu_0,\sigma_0^2]$
$Pr(w=1|,\bm{\theta})=Norm_x[\mu_1,\sigma_1^2]$
先验概率：
$Pr(w)=Bern_w[\lambda_p]$
学习算法计算参数集合：
$\bm{\theta}=\{\mu_0,\sigma_0,\mu_1,\sigma_1,\lambda_p\}$
推理算法用贝叶斯：
$Pr(w|x)=\frac{Pr(x|w)Pr(w)}{\Sigma_{w=0}^1Pr(x|w)Pr(w)}$