自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

Ton的博客

深度强化学习

Ton10 CSDN认证博客专家 CSDN认证企业博客

码龄6年

97: 原创

3万+: 周排名

125万+: 总排名

46万+: 访问

: 等级

2570: 积分

718: 粉丝

849: 获赞

201: 评论

3336: 收藏

私信

关注

分类专栏

超分 25篇
深度学习 11篇
NLP 5篇
Meta-RL 10篇

最新评论

论文笔记之Stein变分梯度下降
武汉大学-赵智博: 你好源码链接，现在打不开了，可以再放一下源码吗
论文笔记之TRPO
barbara2008: 关于(1)的证明， V^pi(S)根据定义应该是策略pi下的所有折扣return的和的期望，本身已经是常量了，与采样没什么关系，对常量求期望还是常量
强化学习之基于gym环境的DQN算法实战（Pytorch）
error_u: 有了吗俺也需要呜呜
超分之ESPCN
nailixiaomianbao: 这个和反卷积的不同之处在哪里呢
超分之ESPCN
nailixiaomianbao: 作者我想问下这个最后一层的特征图数量为什么是r的平方呢，根据什么推理得到的呢

最新文章

Meta-RL

关注

文章平均质量分 96

关注数：文章数：10 文章阅读量：17497 文章收藏量：92

作者: Ton10

肩上带风的tt

展开