IS分数(Inception Score):衡量图像质量和多样性
FID距离(弗雷彻特初始距离):衡量图像质量和多样性
VSS(VisualSemantic Similarity)视觉语义相似度:衡量图像与输入文本的语义匹配度
R-precision(R精度):评估生成图像与对应文本描述之间的视觉-语义相似度
补充信息熵的计算:
IS分数,越高越好。
对于图像质量。借助了一个外部图像分类器。p(y|x)的熵越小,说明数据分布较为集中(熵越大,代表分布越混乱)。y表示类别标签,x表示生成的图像。如果图像可以以很高的置信度被判别为某一类别,说明具有很好的清晰度和辨识度;如果难于明确分类,则说明图像质量差。
一般使用在ImageNet上训练好的Inception-v3网络。
对于图像多样性。如果GAN生成的图像具有很好的多样性,那么理应这些图像属于不同类别的概率是相同的,也就是图像属于不同类别的概率分布的信息熵越大越好。