元强化学习初步

最新推荐文章于 2024-05-05 01:56:49 发布

rockray21

最新推荐文章于 2024-05-05 01:56:49 发布

阅读量1.7k

点赞数 1

分类专栏：强化学习文章标签：强化学习

本文为博主原创文章，转载请声明作者rockray21。如有问题，欢迎指正。

本文链接：https://blog.csdn.net/rockray21/article/details/108681266

版权

元强化学习

如有错误，欢迎指正
- 所引用内容链接
元学习
- 元学习方法
元强化学习概念
元强化学习背景
元强化学习内容
个人感想

如有错误，欢迎指正

本篇为自我学习过程中的要点记录，仅作学习使用。
所引用内容的链接将全部粘贴于下方，如有侵权，请与本人联系。

所引用内容链接

让机器像人类一样学习? 伯克利 AI 研究院提出新的元强化学习算法: https://www.leiphone.com/news/201906/hF46xpHkFrSVXilN.html.

元强化学习研究笔记: https://huangwang.github.io/2019/01/27/%E5%85%83%E5%BC%BA%E5%8C%96%E5%AD%A6%E4%B9%A0%E7%A0%94%E7%A9%B6%E7%AC%94%E8%AE%B0/.

元强化学习: https://blog.csdn.net/qq_27465499/article/details/105101772.

下面这个文章是重点！！！
元强化学习简介: https://www.cnblogs.com/lucifer1997/p/13603979.html.

元学习

Meta Learning研究Task！Meta Learning的目的是希望学习很多很多的task，然后有了这些学习经验之后，在面对新的task的时候可以游刃有余，学的快又学的好！那为什么叫Meta呢？Deep Learning是在Task里面研究，现在Meta Learning是在Task外面，更高层级来研究。也就是在Meta Learning的问题上，Task是作为样本来输入的。

Meta RL（Meta Reinforcement Learning）是Meta Learning应用到Reinforcement Learning的一个研究方向，核心的想法就是希望AI在学习大量的R

最低0.47元/天解锁文章

关注

1
点赞
踩
20

收藏

觉得还不错? 一键收藏
0
评论
元强化学习初步

元强化学习如有错误，欢迎指正所引用内容链接元学习元学习方法HyperNetwork 生成参数Conditional Neural Network 条件神经网络MAML 基于梯度的做法优缺点元强化学习概念元强化学习背景元强化学习内容元参数未来方向个人感想如有错误，欢迎指正本篇为自我学习过程中的要点记录，仅作学习使用。所引用内容的链接将全部粘贴于下方，如有侵权，请与本人联系。所引用内容链接让机器像人类一样学习? 伯克利 AI 研究院提出新的元强化学习算法: https://www.leiphone.c
复制链接

扫一扫

专栏目录

rockray21 CSDN认证博客专家 CSDN认证企业博客

码龄6年

20: 原创

18万+: 周排名

132万+: 总排名

4万+: 访问

: 等级

306: 积分

25: 粉丝

50: 获赞

13: 评论

297: 收藏

私信

关注

热门文章

分类专栏

深度学习 1篇
强化学习 11篇
技术 1篇
姿态检测 2篇
学术 3篇

最新评论

MADRL（多智能体深度强化学习）
Knight8520: 会有，建议看看联邦学习可以解决
MADRL（多智能体深度强化学习）
lianbangcainiao: 中心化训练会不会出现数据隐私泄露的问题啊
T-LESS: An RGB-D Dataset for 6D Pose Estimation of Texture-less Objects
baojunchencc: 这个数据集可以用于做目标识别吗？
python实现socket互传json文件
weixin_50471167: 这注释还不清楚？看不懂说明自己技术还不够理解这个。了解了socket和json基本都能看懂吧，这两者又不难理解
AAAI 2020多智能体强化论文
ctotalk: 学习了。

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。