AAAI 2021-TextGAIL:Generative Adversarial Imitation Learning for Text Generation
motivation1)Exposure bias problem of MLE2)The text generated by GAN is Substantially worse than the text generated by MLE什么是TextGAIL?什么是TextGAIL?就是拓展在Text上的GAIL,什么是GAIL,GAIL是一个模仿学习框架。什么是模仿学习,举个例子,如果你跟着教练打网球,你把教练打网球的policy学到了,个人理解就是对于公式中的特定state,做出相应
原创
2021-08-27 14:47:05 ·
439 阅读 ·
0 评论