FID指标复现踩坑避坑 文本生成图像FID定量实验全流程复现(Fréchet Inception Distance )定量评价实验踩坑避坑流程

一、FID分数简介

FID全称为:Fréchet Inception Distance。

FID分数用于根据预训练网络提取的特征,测量真实图像分布和生成图像分布之间的距离。真实图像在空间中是服从一个分布的(假设为正态分布),而GAN生成的特征也是一个分布,GAN做的事情就是不断训练使这两个分布尽可能的相同。FID就是计算这两个分布直接的距离,使用的距离算法叫做Frechet distance。

FID计算两个分布之间的距离,距离越小代表生成的分布越贴近于真实分布,故FID越小越好。

二、FID分数 CUB定量实验步骤

2.1、下载FID计算代码

github下载:https://github.com/MinfengZhu/DM-GAN/tree/master/eval/FID

在这里插入图片描述
将其放入code目录中
在这里插入图片描述

2.2、下载FID预训练好的模型

谷歌云盘链接:https://drive.google.com/file/d/1747il5vnY2zNkmQ1x_8hySx537ZAJEtj
CSDN链接:FID训练好的模型 针对CUB-birds的FID预训练模型

CSDN链接:FID训练好的模型 针对COCO的FID预训练模型

下载后是一个npz文件,将其放入指定文件夹位置
在这里插入图片描述

2.3、输入终端命令

打开终端,输入命令为:python fid_score.py --gpu 0 --batch-size 24 --path1 eval/FID/bird_val.npz --path2 ../test/valid/single
其中后面的两个参数path1代表你放FID预训练的模型所在位置,path2代表你放生成的图片的位置。

运行后显示:
在这里插入图片描述

2.4、注意事项

1、计算FID一般需要30000张生成图像,如果只有3000张是测不准的;
2、计算FID的标准方法目前还不统一,用不用imagenet 预训练的参数测出来的FID也不一样,本篇仅仅是一种做法,目前看来可能还不够严谨,仅供参考。

最后

💖 个人简介:人工智能领域研究生,目前主攻文本生成图像(text to image)方向

📝 个人主页:中杯可乐多加冰

🔥 限时免费订阅:文本生成图像T2I专栏

🎉 支持我:点赞👍+收藏⭐️+留言📝

另外,我们已经建立了微信T2I学习交流群,如果你也是T2I方面的爱好者或研究者可以私信我加入。

如果这篇文章帮助到你很多,希望能不吝打赏我一杯可乐!多加冰哦!

  • 12
    点赞
  • 68
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 31
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 31
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

中杯可乐多加冰

请我喝杯可乐吧,我会多加冰!

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值