一些GAN文章

该博客探讨了如何应用条件生成对抗网络(Conditional GAN)进行常识机器理解,通过改进的句子和文章表示网络提升判别器性能。同时介绍了Adversarial connective-exploiting networks在隐含话语关系分类中的应用,采用对抗学习策略使得模型能准确预测隐含关系。
摘要由CSDN通过智能技术生成

Conditional GAN for Commonsense Machine Comprehension

问题

机器理解

这里写图片描述

判别器构造

句子表示网络和文章表示网络

句子表示网络使用GRU,并假设最后一个单词cell的hidden representation作为句子的表示。
文章表示网络使用的也是GRU,运用attention模型,如图所示,第四个句子有关键信息,因此在构建文章表示网络时格外注重这个句子。
这里写图片描述

生成器构造

与传统的GAN从随机噪声z来构造相比,在这篇论文中,context representation作为生成器附加输入。这样做的目的是使生成的句子必须与上下文相适应。
generator decoder:
这里写图片描述

其余改进:

  • 使用Gumbel-softmax替代softmax+argmax
  • 生成器并不是随机初始化的,而是使用ground truth预训练的
  • 向辨别器中加入了微小的噪声以使生成器输出概率mass更平滑
  • 如果G的loss比D大很多,更新G的参数就更频繁,反之亦然

Adversarial connective-exploiting networks for implicit discourse relation classification

问题

这里写图片描述
对隐含关系进行分类(抽取):两个句子之间的话语关系是Cause,隐含关系推测的结果是Because。
目标是在不使用Discourse relation的情况下推测出implict relation。

对抗网络

这里写图片描述

  • i-CNN的输入是原语句
  • a-CNN的输入是原语句加上隐含关系(类似于生成器)
  • 判别器D用于分辨出两个CNN的特征
  • 分类器C和i-CNN最终用于关系预测

特别工作

为了使i-CNN和分类器所预测的结果尽可能的接近加上关系的a-CNN的结果,采取了零和博弈,预测模型在最小化误差的同时要使判别器D尽可能地难以区别两种模型的结果。

生成器

i-CNN:
这里写图片描述
Classifier: Softmax

判别器

这里写图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值