GAN(生成对抗网络)

GAN,Generative Adversarial Network.

起源于2014年,NIPS的一篇文章,Generative Adversarial Net.

GAN, 是一种二人博弈的思想,双方利益之和是一个常数,是固定的。你的利益多点,对方利益就少点。
GAN里面,博弈双方是:一个叫G(生成模型),另一个叫D(判别模型)。

两个模型都有各自的输入输出(类似于函数)。
生成模型(G):输入是噪声、样本(一组随机数),输出是一个逼真的样本。
判别模型(D):相当于二分类器(0-1),判断输入样本是真是假。(类似于匹配模型,输入两个样本,输出是否匹配)真样本标1,生成的假样本标0.

GAN模型最终目标:判别器和生成器的对抗,判别器尽可能提高判别能力(判断样本是真是假);生成器尽可能提升样本生成的真实性,让判别器判别不出真假。
判别器对于真假样本输出概率都是0.5、这时候就平衡了。

对于设计者的我们,希望谁赢就设计成什么样的网络。 要得到以假乱真的样本,就希望生成样本不被判别器判断出来。就输出0.5的概率。

想训练判别器,二分类,标1,标0.

想训练生成器,需要联合判别器一起训练,才会形成误差,假样本全部设为1,不要判别器的参数发生变化。

GAN用于提升语音情感识别

1.一个vanilla GAN,学习高维向量的低维表示的分布,
2.一个conditional GAN, 学习高维特征向量分布附带它所属的情感类别标签。

用实际数据训练,去生成数据,在分类性能上有明显提升。

用speech data去做情感识别现在很流行,该数据收集很容易,数据无损,便宜。
可是数据size规模受限,

GAN在图像领域很popular,生成看起来很真实的图像,在语音情感识别中也可以。

  1. a vanilla GAN, 生成一个实际向量的压缩版本;
  2. a conditional GAN, 生成实际的高维向量(从压缩版本)
    实验目标:评估 这些合成的特征数据,可以带来多少性能提升。

GAN在图像生成,图像转换,对话生成上,已经表现很好。
主要是学习特征表示。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值