FID score

FID是一种评估生成图像质量的技术,通过比较生成图像与真实图像的统计特性,使用Inceptionv3模型的特征向量和Frechet距离计算。较低的FID分数表示生成图像质量高,反之则低。计算FID涉及预训练模型的特征提取和分布比较。
摘要由CSDN通过智能技术生成

FID score

什么是FID

Frechet Inception Distance 是FID的缩写,是评估生成图像质量的指标。

FID score 是作为对Inception Score 的改进提出的。inception score是根据表现很好的图片分类模型Inception v3分类生成图片集合的分类结果好坏得到的。这个分数结合了每个合成图像的条件类预测的置信度(quality)和预测类的边际概率的积分(diversity)。

quality可以这样理解,针对每个图片得到的结果是一个概率向量,那么就希望它所属于的那个类别的概率尽可能的大,而其他概率尽可能小;diversity也就是多样性,就是要使得将生成的图片集合的概率向量相加得到的概率分布(marginal distribution)尽可能贴近均匀分布。通过kl散度可以将两者进行融合,原理就是希望 p ( y ∣ x ) p(y|x) p(yx) p ( y ) p(y) p(y)之间的距离大一些,这样结果会好一些。
在这里插入图片描述

IS没有评估生成图片与真实图片的比较。FID就考虑了生成图片的统计数据与真实数据的统计数据之间的比较。

像inception score一样,FID得分也使用了Inception v3模型。具体来说,使用了模型的编码层(输出图像分类之前的最后一个池化层)来捕捉输入图像的计算机视觉特定特征。这些激活值是对真实和生成的图像集合计算得出的。

这些激活值被总结为一个多变量高斯分布,方法是计算图像的均值和协方差。然后,对真实和生成图像集合中的激活值计算这些统计数据。

然后使用frechet距离(也称为Wasserstein-2距离)计算这两个分布之间的距离。

较低的FID表示图像质量更好;相反,较高的得分表示图像质量较低,这种关系可能是线性的。

在这里插入图片描述

怎么计算FID

FID得分的计算首先需要加载一个预训练的Inception v3模型。

模型的输出层被移除,输出取自最后一个池化层,即全局空间池化层。

这个输出层有2048个激活值,因此,每张图像被预测为2048个激活特征。这被称为图像的编码向量或特征向量。

然后,为问题领域中的一组真实图像预测出2048个特征向量,以提供真实图像表示方式的参考。然后可以为合成图像计算特征向量。

结果将是两组真实和生成图像的2048个特征向量。

然后,根据论文中的以下方程计算FID得分:
d 2 = ∣ ∣ μ 1 – μ 2 ∣ ∣ 2 + T r ( C 1 + C 2 – 2 ∗ s q r t ( C 1 ∗ C 2 ) ) d^2 = ||\mu_1 – \mu_2||^2 + Tr(C_1 + C_2 – 2*sqrt(C_1*C_2)) d2=∣∣μ1μ22+Tr(C1+C2–2sqrt(C1C2))
其中 μ \mu μ是均值,C是协方差矩阵

  • 19
    点赞
  • 21
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值