读论文《Toward Controlled Generation of Text》

最新推荐文章于 2023-04-08 16:56:11 发布

梦柏

最新推荐文章于 2023-04-08 16:56:11 发布

阅读量3k

点赞数 3

分类专栏：论文学习笔记文章标签：论文读后感神经网络文本生成

本文链接：https://blog.csdn.net/qq_35575638/article/details/81590025

版权

本文详细解读了Zhiting Hu在ICML2017发表的论文《Toward Controlled Generation of Text》，该论文提出了一种基于VAE和判别器D的结构，用于生成可控属性的文本。通过引入新变量c，结合隐变量z，实现对文本特定属性的定向生成。论文解决了NLP连续问题不可导及属性纠缠的问题，通过优化算法和损失函数设计，实现了属性独立和半监督学习。实验表明，模型在情感和时态控制上取得了优于基线的效果。

摘要由CSDN通过智能技术生成

Toward Controlled Generation of Text这篇论文是Zhiting Hu发布在ICML2017上的paper。这篇paper主要干的事情就是其题目中所描述的，生成可以控制方向的文本，方向也就是文本的各种属性。

这篇paper中提出来的结构是基于VAE的，将VAE和一个判别器D结合的结构。文中刚开始便提到，如果要用VAE做定向的文本生成，必须克服两个困难，一是NLP问题是连续问题不可导，二是VAE中的隐变量z中各项属性是相互纠缠在一起的，不能单独的控制单个属性的定向生成。为了克服这两个问题，作者在优化的时候采取了一些措施，下面会提到。

为了实现定向文本生成，paper中采取了用一个新的变量c与原来VAE中的隐变量z相结合，其中c关联着句子中想要控制的特定属性，而z则控制着其他属性。通过变量的分布（z，c）来生成句子后作为判别器D的输入，而D又根据这些输入来训练改变c的分布，整个模型的结构示意图如下：

图中如果没有下面的判别器D的话，就是一个原始的VAE，而判别器加入是为了得出c的分布。图中蓝色和红色的箭头分别表示的是模型对于独立性的判别方法和优化方法。就优化方法而言，整个模型的优化其实有点像wake-sleep算法，文章中也有提到过，就是交替优化VAE和判别器D，并且有一种竞争优化的感觉。

具体来讲，对于生成器G，其生成输出的过程可描述为：

最低0.47元/天解锁文章

梦柏

关注

3
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
读论文《Toward Controlled Generation of Text》

Toward Controlled Generation of Text这篇论文是Zhiting Hu发布在ICML2017上的paper。这篇paper主要干的事情就是其题目中所描述的，生成可以控制方向的文本，方向也就是文本的各种属性。这篇paper中提出来的结构是基于VAE的，将VAE和一个判别器D结合的结构。文中刚开始便提到，如果要用VAE做定向的文本生成，必须克服两个困难，一是NLP问...
复制链接

扫一扫