1.记录一次与大神们的关于GAN应用于NLP的讨论(简书)
http://www.jianshu.com/p/32e164883eab
总结
- 目前尝试的内容:纯文本生成,诗歌生成,唐诗生成,机器翻译,IR,中文分词,文本分类
- 主要思路:考虑使用D进行真假判别,然后用RL的policy gradient的方式来打分和更新
- 使用word2vec之类的连续向量,微调之后不能代表一个有意义的词语,可以考虑取最近的点,但是存在bias,对于部分生成的序列,十分难判断其在之后生成整个序列时的分数
- IR GAN 没有使用attention机制
- 生成文本的方法:gumble softmax,policy gradient
- GAN可能适合的方向:半监督学习,文本分类
- 后续各种文本生成+GAN都是用seqGAN的套路,另外一种做法是在文本自编码器中的编码层做对抗训练
2.SeqGAN(CSDN)
http://blog.csdn.net/yinruiyang94/article/details/77675586
论文: