摘要与总结
将内容和风格在隐空间解耦在不成对文本风格迁移的是非常流行的,然而现在的模型不太行,主要体现在两点:
模型
Z是经过编码后的文本表示,S是style embedding
Discriminator Network
因为缺少平行语料,没法直接获得风格不为S的迁移后的监督文本,本文提出一种判别网络来从非平行预料中学习到这种监督
为了更好的保存内容,训练一个网络,用文本为X,风格不为S的样本去迁移到风格为S的文本
为了风格控制,训练一个判别网咯来辅助style transformer更好的控制生成文本的风格
Conditional Discriminator
条件判别器的作用是判别输入的文本的风格是否为S
在训练阶段,风格为S的为正类,其他的为负类
训练的目的是将正类的概率最大化
Multi-class Discriminator
跟前面一个判别器不同,在这里只有一条文本输入到这个判别器,然后判别器需要输出这条文本的风格S
在网络的学习阶段,训练网络将负样本的识别概率最大化
训练
把 x 和
f
θ
(
x
,
s
)
f_\theta(x,s)
fθ(x,s) 从负样例中判别出来
总体的训练:
实验
评价
我的评价是:???有点懵逼
开玩笑哈,这个style transformer借鉴了GAN的想法,自己去生成负样例然后去训练判别网络,直到收敛,我觉得这个想法挺novel的但是又还好(就是把GAN迁移到文本上),但是能实现出来确实牛逼,但是就是绕来绕去让我这个菜b有点晕,感觉可以更清晰的表达出来?