生成式模型的质量评估标准

最新推荐文章于 2025-02-18 15:54:30 发布

为啥不能修改昵称啊

最新推荐文章于 2025-02-18 15:54:30 发布

阅读量2k

点赞数 2

分类专栏： diffusion 机器学习文章标签：机器学习 python 人工智能

本文链接：https://blog.csdn.net/weixin_43845922/article/details/130936489

版权

diffusion 同时被 2 个专栏收录

10 篇文章

订阅专栏

机器学习

9 篇文章

订阅专栏

Sample Quality Matrix

如何评价生成式模型的效果？
IS
FID
sFID
Precision & Recall

如何评价生成式模型的效果？

Quality: 真实性（逼真，狗咬有四条腿）

Diversity: 多样性（哈巴狗，金毛，吉娃娃，中华田园犬）

IS

Inception Score
$\frac{p(y|x))}{log(p(y)}$

Inception-V3是一个图像分类的模型，在imageNet上进行训练得到的预训练模型

p(y|x)：即我们的模型生成的照片，它属于某个类别的概率

p(y)：即边缘概率
在这里插入图片描述

#用代码实现IS 
def calculate_inception_score(p_yx, eps=1E-16):
    # p_yx 即p(y|x)
    # calculate p(y)
    p_y = expand_dims(p_yx.mean(axis=0), 0)
    #kl divergence for each image
    kl_d = p_yx * (log(p_yx + eps) - log(p_y + eps))
    # sum over classes 
    sum_kl_d = kl_d.sum(axis=1)
    # average over images 
    avg_kl_d = mean(sum_kl_d)
    # undo the logs 
    is_score = exp(avg_kl_d)
    return is_score

FID

Frechlet Inception Distance(FID)

鉴于IS的缺点，就有了FID的出现，它是一个距离的量，即和真实的图片(训练集)的一个对比

FID也是用Inception-V3这个预训练好的图像分类模型，但它用的不是分类概率了，而是中间的一个feature vectors

即：把生成的照片和训练集中真实的照片同时送入到Inception-V3中，将二者经过Inception-V3模型得到的中间的特征向量拿出来，算出一个高斯分布的统计量，再去计算这两个分布之间的一个W2距离。

在这里插入图片描述
$d^2=||\mu_1-\mu_2||^2+Tr(C_1+C_2-2\sqrt{C_1*C_2})$

# 用代码实现FID

def calculate_fid(act1, act2):
    '''
    act1:2048dim的隐变量，真实的图片送入Inception-V3中得到的
    act2:2048dim的隐变量，预测的图片送入Inception-V3中得到的
    '''
    # calculate mean and covariance statistics 
    mu1, sigma1 = act1.mean(axis=0), cov(act1, rowvar=False)
    mu2, sigma2 = act2.mean(axis=0), cov(act2, rowvar=False)
    # calculate sum squared difference between means 
    ssdiff = numpy.sum((mu1 - mu2)**2.0)
    # calculate sqrt of product between cov 
    covmean = sqrtm(sigma1.dot(sigma2))
    # check and correct imaginary numbers from sqrt 
    if iscomplexobj(covmean):
        covmean = covmean.real
    # calculate score 
    fid = ssdiff + trace(sigma1 + sigma2 - 2.0 * covmean)
    return fid

对于IS和FID，一般都是同时使用，而不是只使用其中一个