《计算机视觉》读书笔记（一）第2章

最新推荐文章于 2021-12-31 22:25:13 发布

随机ID

最新推荐文章于 2021-12-31 22:25:13 发布

阅读量1.5k

点赞数

分类专栏：《计算机视觉模型、学习和推理》读书笔记

本文链接：https://blog.csdn.net/qq_33445835/article/details/99756597

版权

《计算机视觉模型、学习和推理》读书笔记专栏收录该内容

6 篇文章 8 订阅

订阅专栏

文章目录

- 第2章概率概述

第2章概率概述

2.1 随机变量

随机变量 $x$ 表示一个不确定的数量，可以是连续或者离散的
概率分布 $P r (x)$
离散变量的概率分布可以用直方图或Hinton图表示，每个结果有一个正概率，概率之和为1
连续变量的概率分布可以用概率密度函数（PDF）来表示，概率密度表示随机变量的取该值的相对可能性，可以取任意正值，然而，PDF的积分总是1

2.2 联合概率

$x$ 和 $y$ 的联合概率分布表示记作 $P r (x, y)$ ，逗号可以理解为“和”，所有结果的概率之和总是1

2.3 边缘化

1.如果 $x$ 和 $y$ 连续，并且已知 $P r (x, y)$ ，那么
$Pr(x)=\int Pr(x,y)\text{d}y$
$Pr(y)=\int Pr(x,y)\text{d}x$
2. 已知 $P r (x, y)$ ，求 $P r (x)$ 和 $P r (y)$ 称为边缘分布，其他变量的积分/求和过程称为边缘化
3. 计算概率分布 $P r (x)$ 的过程可以解释为计算 $x$ 的概率分布且忽略（或不考虑） $y$ 的值

2.4 条件概率

给定 $y$ 取 $y^*$ 时 $x$ 的条件概率记作 $Pr(x|y=y^*)$ ，“|”可以理解为“给定”
条件概率 $Pr(x|y=y^*)$ 可以由联合分布中的切片 $Pr(x,y=y^*)$ 计算出来，切片值表示当 $y=y^*$ 时 $x$ 取不同值的相对概率。因为它们仅构成联合分布的一部分，总和不为1，所以计算条件概率分布，需要规范化切片中的总概率
$Pr(x|y=y^*)=\frac{Pr(x,y=y^*)}{\int{Pr(x,y=y^*)}}=\frac{Pr(x,y=y^*)}{Pr(y=y^*)}$
上式简化缩写为 $Pr(x|y)=\frac{Pr(x,y)}{Pr(y)}$ 重新整理得：
$P r (x, y) = P r (x ∣ y) P r (y)$
多变量时，可以不断应用条件概率分布将联合概率分布分解为乘积形式：
$P r (w, x, y, z) = P r (w, x, y ∣ z) P r (z)$
$= P r (w, x ∣ y, z) P r (y ∣ z) P r (z)$
$= P r (w ∣ x, y, z) P r (x ∣ y, z) P r (y ∣ z) P r (z)$
$P r (w ∣ x, y, z)$ 表示在给定 $x, y, z$ 的情况下 $w$ 的概率

2.5 贝叶斯公式

贝叶斯公式：
$Pr(y|x)=\frac{Pr(x|y)Pr(y)}{Pr(x)}$
$=\frac{Pr(x|y)Pr(y)}{\int Pr(x,y)\text{d}y}$
$=\frac{Pr(x|y)Pr(y)}{\int Pr(x|y)Pr(y)\text{d}y}$
后验概率： $P r (y ∣ x)$ ，代表给定 $x$ 下 $y$ 的概率
先验概率： $P r (y)$ ，代表在考虑 $x$ 之前 $y$ 的概率
似然性： $P r (x ∣ y)$
证据： $P r (x)$
在计算机视觉中，常用条件概率 $P r (x ∣ y)$ 表示变量 $x$ 和 $y$ 的关系，然而我们主要感兴趣的是变量 $y$ ，因此，概率 $P r (y ∣ x)$ 就用贝叶斯公式来计算

2.6 独立性

如果从变量 $x$ 不能得到变量 $y$ 的任何信息（反之亦然），就称 $x$ 和 $y$ 是独立的，可以表示为：
$P r (x ∣ y) = P r (x)$
$P r (y ∣ x) = P r (y)$
代入条件概率公式中可得：
$P r (x, y) = P r (x ∣ y) P r (y) = P r (x) P r (y)$

2.7 期望

如果从概率分布中抽取大量样本，计算每个样本的函数，并求这些值的平均值，其结果就是期望。在离散及连续情况下，一个随机变量 $x$ 的函数 $f[\cdot]$ 的期望值分别定义为
$E[f[x]]=\sum_x f[x]Pr(x)$
$E[f[x]]=\int f[x]Pr(x)\text{d}x$
特殊函数的期望
期望的四条性质
$E [k] = k$
$E [k f [x]] = k E [f [x]]$
$E [f [x] + g [x]] = E [f [x]] + E [g [x]]$
$E [f [x] g [y]] = E [f [x]] E [g [y]] （若 x 和 y 独立）$