KL散度，IS，FID

喝点暖气水叭

于 2022-10-10 19:21:29 发布

阅读量395

点赞数

分类专栏：计算机视觉文章标签：深度学习人工智能机器学习计算机视觉

本文链接：https://blog.csdn.net/xjlzds/article/details/127248100

版权

计算机视觉专栏收录该内容

2 篇文章 0 订阅

订阅专栏

KL散度

一般用于度量两个概率分布函数之间的“距离”。
公式如下：

$\sum_{x∈X}[P(x)log \frac{P(x)}{Q(x)} ]=E_{ x∼P(x)} [log \frac{P(x)}{Q(x)} ]$

KL散度的典型应用场景如下：假设某优化问题中, $P (X)$ 是真实分布， $Q (X)$ 是一个用于拟合 $P (X)$ 的近似分布，可以尝试通过修改 $Q (X)$ 使得二者间的 $K L [P (X) ∥ Q (X)]$ 尽可能小,来实现用 $Q (X)$ 拟合 $P (X)$

注意：
KL散度关于 $P (x) 、 Q (x)$ 是不对称的，即 $\neq KL[Q(X)∥P(X)]$ ，在一些方法使用时注意变量位置。

IS(Inception Score)

Inception 网络是图片分类器。
这里定义：
$p (y)$ : N个生成的图片，每个图片都输入到Inception网络中进行分类，得到的自己的概率分布向量，然后求平均，得到边缘分布。
$p (y ∣ x)$ : 把生成的图片x输入到Inception网络中，得到1000维向量y（Inception基于ImageNet数据库进行训练），也就是该张图片属于各个类别的概率分布。（理解：某个维度值越大，说明越清晰，与其他类别越不同，越好）
在这里插入图片描述
只要p(y|x)和 p(y)的距离足够大，就能证明这个生成模型足够好。