论文《Controllable Unsupervised Text Attribute Transfer via Editing Entangled Latent Representation》阅读笔记
论文来源:2019 NIPS
论文主要贡献:提出了一种非监督方式的文本属性转换框架,通过改变文本属性分类器的属性来对latent representation【就是原始风格文本经过encoder部分后得到的表示】进行一些修改。
论文代码:https://github.com/Nrgeup/controllable-text-attribute-transfer
论文主要内容
作者说他们不同于传统的方法,将属性和内容表示分开进行建模,作者直接使用内容和属性缠绕在一起的表示。
文中的模型主要分为两部分,一个是基于transformer的AutoEncoder,一个是Attribute Classifier[属性分类器]。
- 作者首先将AutoEncoder和Attribute Classifier分开来训练
- 然后使用encoder部分去获得source sentence的隐层表示
- 再用FGIM算法去不断编译这个隐层表示,直到这个表示能够被分类器判定为target属性
- 最后在使用decoder从这个隐层表示获取target text.
文中提出的模型结构如下:
如图所示,作者对encoder在encoder部分是两层的transformer结构,并在其后接了一层GRU。经过encoder后得到一个latent representation,但是目前的这个latent representation是source风格的,我们希望这个latent representation是target风格的,那么作者是怎么将这个latent representation由source风格转为target风格的呢?作者提出了一个FGIM算法来修改这个latent representation.
FGIM算法的伪代码如下:
FGIM算法的流程如下:
-
输入包括:
- 原始的latent representation - z;
- 一个训练好的Attribute Classifier - C θ c C_{\theta_c}