GAN系列:论文阅读 & 代码阅读——Conditional Generative Adversarial Nets(CGAN / Conditional GAN)

这篇论文真的好简短,代码也只用改一点点就可以,非常简单。

论文里提出Conditional GAN的概念有两个motivations:

1. 分类问题中如果类别过多,分类变难

2. 一张图片可能有多种标签,不是一对一的映射

文中称第一个问题为Multimodal,举例Flicker数据集,每张图片可能具有多个语义接近但表现形式不同的标签(也有可能语义不同)。这里涉及到自然语言处理的问题,将标签转换为某种向量形式,对于类内:同一张图片对应多个标签向量,向量间有细微差距,其实扩大了类别的范围(鲁棒性?),而且可能在预测时产生新的标签(因为预测的结果不再是标量,而是向量);对于类间:不同图像尽管类别不同,但是根据向量具有的语义性,类间的差距不再完全一致(标签具有语义后,某些类别类间差距一定小于某些类别),即使分类错误,也可以根据预测结果和真值间的向量范数得到语义偏离程度的大小,相当于细化了误差的组成,分类能力一定有所提升,可以一定程度上解决类别过多的问题。这种方法的实际操作其实就是对标签进行编码,预测编码后的向量。

第二个问题中,一张图片对应多个标签时,将其视为是多种条件下的标签,即一个标签对应一种条件限制。这样模型就变成了在某个条件下进行预测,模型的输入也变成了某个条件下的图片。因此一张图片对应多个条件时,搭配着每一个条件,都要分别做一次训练。这个条件的概念是比较抽象的,简单一点可以是图像标签,复杂的可能是某些抽象特征等,有待尝试。

Conditional GAN的结构:条件condition用

  • 0
    点赞
  • 13
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值