Improving Sequence Generation by GAN
sequence generator的应用很多,甚至强化学习也算是sequence generator。
1.Conditional Sequence Generation
输入是一个sequence或者scale,输出是一个sequence。
2.传统Sequence-to-sequence
3.RL (human feedback)
Chat-bot的目标就是要把分数最大化。把这个事情模型化表达:
数学的推导
4.Policy Gradient Implemenation
左边的红框,先输入N个句子给Chatbot,得到N个回答(相当于采样),然后人对这N个问答进行评分,再更新参数
5.GAN (discriminator feedback)
6.Algorithm
7.Unsupervised Conditional Sequence Generation
实际上它往往可以在训练集特别小的情况下训练出超过Supervised Conditional Sequence Generation的效果,但是如果数据集足够大,最后的结果往往不理想。
8.Projection to Common Space
这个方法是把两个domain的特征都抽取到同一个公共向量上
9.Unsupervised Abstractive Summarization