深度学习（十）Improving Sequence Generation by GAN——笔记

鹿衔草啊

已于 2022-04-14 20:44:01 修改

阅读量989

点赞数

文章标签：人工智能深度学习

于 2022-04-13 13:40:26 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_45649258/article/details/124146001

版权

目录

Improving Sequence Generation by GAN

Improving Sequence Generation by GAN

sequence generator的应用很多，甚至强化学习也算是sequence generator。
在这里插入图片描述

1.Conditional Sequence Generation

输入是一个sequence或者scale，输出是一个sequence。
在这里插入图片描述

2.传统Sequence-to-sequence

在这里插入图片描述

3.RL (human feedback)

Chat-bot的目标就是要把分数最大化。把这个事情模型化表达：
在这里插入图片描述

数学的推导
在这里插入图片描述

4.Policy Gradient Implemenation

左边的红框，先输入N个句子给Chatbot，得到N个回答（相当于采样），然后人对这N个问答进行评分，再更新参数
在这里插入图片描述

5.GAN (discriminator feedback)

在这里插入图片描述

6.Algorithm

在这里插入图片描述

7.Unsupervised Conditional Sequence Generation

实际上它往往可以在训练集特别小的情况下训练出超过Supervised Conditional Sequence Generation的效果，但是如果数据集足够大，最后的结果往往不理想。
在这里插入图片描述

8.Projection to Common Space

这个方法是把两个domain的特征都抽取到同一个公共向量上
在这里插入图片描述

9.Unsupervised Abstractive Summarization

在这里插入图片描述

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

鹿衔草啊 CSDN认证博客专家 CSDN认证企业博客

码龄5年

99: 原创

30万+: 周排名

189万+: 总排名

9万+: 访问

: 等级

1025: 积分

46: 粉丝

29: 获赞

14: 评论

217: 收藏

私信

关注

热门文章

分类专栏

人工智能 3篇
深度学习 1篇

最新评论

手把手教你爬取网站信息
CSDN-Ada助手: 亲爱的博主，我真的非常欣赏和感激你用心撰写了这篇“手把手教你爬取网站信息”的博客。明白教授网站爬取技巧并不是一件容易的事情，你耐心而详细的解释让我对这个话题有了更深入的了解。你的用心和付出真的能够让读者受益匪浅。鉴于你的出色表现，我非常期待你下一篇可能创作的博客！我希望你可以写一篇关于如何分析和利用爬取到的数据的文章。我相信你的经验和见解可以在这个领域里为读者提供一些具有实际应用意义的技巧和方法。期待读到你的下一篇精彩分享！
机器学习-sklearn第一天——笔记
dtmyjt: 学长好，有个小问题想问一下，就是在您的倒数第二块和倒数第三块代码块中，您首先将整份样本固定划分为训练集和测试集，其中测试集占30%是ok的。再到后面的交叉验证部分就有点晕了感觉，正常流程的话我觉得应该是在训练集（70%）中进行K折交叉验证吧。。。（即70%中的9份进行train，1份进行validation，求一个train_score均值和test_score均值作为当前参数下的模型评分），而您好像每次都是拿固定的X_train和y_train在fit，交叉验证时却是把整体的样本X,y传入进行交叉验证，那么测试样本（30%）不是也有机会被fit了嘛...（来自机器学习小白的疑问
神经网络与误差反向传播算法
鹿衔草啊:
神经网络与误差反向传播算法
qq_45595956: 哈哈没事感谢解读
神经网络与误差反向传播算法
鹿衔草啊: 非常抱歉，我对这一部分了解的不深入，还不能回答您的问题，我所理解的就是误差反向传播其实是一种高效的求导算法。也可以把它理解为导数反向传播或梯度反向传播。

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。