- 博客(5)
- 收藏
- 关注
原创 【无标题】nltk安装wordnet出错[nltk_data]Error loading wordnet:<urlopen error [Errno 111]...>
wordnet离线下载链接
2023-06-29 11:08:18 495 1
原创 SeqGAN: Sequence Generative Adversarial Nets with Policy Gradient读书笔记
标准的GAN在处理离散数据时遇到的问题:生成器难以传递梯度更新;鉴别器难以评估非完整序列。对于前者,作者把整个GAN看作一个强化学习系统,用policy gradient更新生成器的参数;对于后者,作者借鉴了蒙特卡洛树的思想,对任意时刻的非完整序列都可以进行评估;生成器:目标函数-各个状态价值的和,状态价值怎么算?策略函数×动作价值,策略函数是用策略网络训练出来的,动作价值不知道怎么办?用roll-out估算出一整个序列的动作就能用判别器计算其动作价值了
2022-04-18 13:53:42 2890
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人