gan怎么输入一维数据_GAN评价指标最全汇总

本文详细介绍了多种用于评估GAN生成效果的指标,包括Inception Score (IS)及其改进版Mode Score、Modified Inception Score、AM Score,以及FID、MMD、Wasserstein Distance、1-Nearest Neighbor Classifier等。文章强调了这些指标在评价多样性、真实性和过拟合问题上的优缺点,并探讨了如何结合不同指标全面评估GAN性能。
摘要由CSDN通过智能技术生成

ce3882dc612ddfbfc23d613420edebf3.png

本文首发于微信公众号:有三AI

作者:小米粥

最近一部分的内容将会比较容易,将和大家一起讨论GAN的评价指标。在判别模型中,训练完成的模型要在测试集上进行测试,然后使用一个可以量化的指标来表明模型训练的好坏,例如最简单的,使用分类准确率评价分类模型的性能,使用均方误差评价回归模型的性能。同样在生成模型上也需要一个评价指标来量化GAN的生成效果。

1. 评价指标的要求

用于评价生成模型GAN优劣的指标不可能是任意的,它应当尽可能考虑一些要求。这里列出几条比较重要的要求:(1)能生成更为真实样本的模型应当得到更好的分数,也就是可评价样本的生成质量(2)能生成更具有多样性样本的模型应当得到更好的分数,也就是可以评价GAN的过拟合、模式缺失、模式崩溃、简单记忆(即GAN只是简单记忆了训练数据集)等问题,即多样性。(3)对于GAN的隐变量

,若有比较明确的“意义”且隐空间连续,那么可控制
得到期望的样本,这样的GAN应该得到更好的评价。(4)有界性,即评价指标的数值最好具有明确的上界、下界。(5)GAN通常被用于图像数据的生成,一些对图像的变换并不改变语义信息(例如旋转),故评价指标对某些变换前后的图像不应有较大的差别。(6)评价指标给出的结果应当与人类感知一致。(7)计算评价指标不应需要过多的样本,不应有较大的计算复杂性。考虑到实际情况,这些要求往往都不能同时得到满足,各个不同的指标也是各有优缺。

2. IS系列

2.1 Inception Score

Inception Score指标适用于评价生成图像的GAN。评价指标首先要评价GAN生成图像的质量好坏,但是图像质量是一个非常主观的概念,不够清晰的宠物狗的图片和线条足够明晰但“很奇怪”的图片均应算作低质量的图片,但计算机不太容易认识到这个问题,最好可以设计一个可计算的量化指标。

IS(Inception Score)采用了这样的做法,将生成的图片

送入已经训练好Inception模型,例如Inception Net-V3,它是一个分类器,会对每个输入的图像输出一个1000维的标签向量
,向量的每一维表示输入样本属于某类别的概率。假设我们的Inception Net-V3训练得足够好,那么对质量高的生成图像
,Inception Net-V3可将其以很高的概率分类成某个类,即标签向量
的数值比较集中,形如
。我们可以使用熵来量化该指标,分布
相对于类别的熵定义为:

其中,
表示
属于第
类的概率,即
值,为了避免歧义,计算方式展示如下图所示:

44b2b96c8df8ee1bfcd8123e329b8f38.png

熵是一种混乱程度的度量,对于质量较低的输入图像,分类器无法给出明确的类别,其熵应比较大,而对于质量越高的图像,其熵应当越小,当

为one-hot分布时,熵达到最小值0。

IS考虑的另一个度量指标即样本的多样性问题,若GAN产生的一批样本

多样性比较好,则标签向量
的类别分布也应该是比较均匀的,也就是说不同类别的概率基本上是相等的(当然这里要假设训练样本的类别是均衡的),则其均值应趋向均匀分布如下图所示。

0c6ea4d537c29e1738c0d2f810b6df86.png

又因为

故可使用标签向量
关于类别的熵来定量描述,若生成样本的多样性好(涵盖的类别多),则
相对于类别的熵越大;生成样本的多样性差,则
相对于类别的熵越小,其中定义
相对于类别的熵为

其中,

表示第
类的概率,即
值。

将图像质量和多样性两个指标综合考虑,可以将样本和标签的互信息

设计为生成模型的评价指标,互信息描述了给定一个随机变量后,另一个随机变量的不确定性减少程度。又被称为信息增益,即
在不知道
前,边缘分布
相对于类别的熵比较大,标签
(可能接近均匀分布)不确定程度比较大;当给定
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值