一些主题文章集合

最新推荐文章于 2022-03-20 13:53:24 发布

hanx0204

最新推荐文章于 2022-03-20 13:53:24 发布

阅读量512

点赞数

分类专栏：打卡文章标签：深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_33254440/article/details/113446179

版权

打卡专栏收录该内容

2 篇文章 0 订阅

订阅专栏

一些论文集合

context-based meta RL

https://mp.weixin.qq.com/s/hMTm38gCccxt-Jnz28Xx1A

PEARL, 2019

MQL, 2020

Enhancing Context-Based Meta-Reinforcement Learning Algorithms via An Efficient Task Encode, 2021 华为诺亚南大 *

Towards Effective Context for Meta-Reinforcement Learning: An Approach Based on Contrastive Learning,2021 华为诺亚天大 *

META-REINFORCEMENT LEARNING ROBUST TO DISTRIBUTIONAL SHIFT VIA MODEL IDENTIFICATION AND EXPERIENCE RELABELING, C Finn 2021 * (Model-based )

Representation

Decouple exploration and exploitation

Learning a good task embedding

Sample efficiency

Off-policy tricks

Model-Based RL

Exploration

Unsupervised training: reward/task proposal

Intrinsic rewards

Batch RL

BCQ(icml’19, nipsDRLW’19),

BEAR(nips’19),

REM(iclr’20 rej),

ABM(iclr’20),

BRPO(2002.icml?),

BRAC-QL (iclr’20 rej),

BAIL(icml’20 under review),

D4RL (2004.sergey.dataset)

作者：爱笑的Groza
链接：https://zhuanlan.zhihu.com/p/143291642
来源：知乎
著作权归作者所有。商业转载请联系作者获得授权，非商业转载请注明出处。

Skill Discovery based on Mutual Information

option找"元动作"

1. 2016 Variational Information Maximisation for Intrinsically Motivated Reinforcement Learning

2. Variational Intrinsic Control

3. Diversity is All You Need: Learning Skills without a Reward Function

4. Dynamics-Aware Unsupervised Discovery of Skills

5. Explore, Discover and Learn:Unsupervised Discovery of State-Covering Skills

6. Dynamics Aware Embedding

7. Mutual Information State Intrinsic Control

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

hanx0204 CSDN认证博客专家 CSDN认证企业博客

码龄9年

17: 原创

13万+: 周排名

55万+: 总排名

8万+: 访问

: 等级

872: 积分

28: 粉丝

48: 获赞

6: 评论

250: 收藏

私信

关注

热门文章

分类专栏

最新评论

Deepmimic安装避坑指北
龙虎山王道长: clang: error: no such file or directory: 'objs/Main.o' 博主请问make python的时候报这个错是什么原因啊
linux通过ftp服务器与ipad 传输文件
爱媛YY: 这波操作非常⑥，[赞][赞][赞]
ubuntu安装deepin-wine2.18-22环境和依赖的方法
东北小狐狸-Hellxz: 现在这个也失效了
ubuntu安装deepin-wine2.18-22环境和依赖的方法
知足者常乐yfm: 阿里云、清华源镜像的链接都已失效。新的链接
ubuntu安装deepin-wine2.18-22环境和依赖的方法
知足者常乐yfm: #!/bin/bash mkdir /tmp/deepintemp cd /tmp/deepintemp wget http://packages.deepin.com/deepin/pool/non-free/d/deepin-wine/deepin-wine_2.18-22~rc0_all.deb wget http://packages.deepin.com/deepin/pool/non-free/d/deepin-wine/deepin-wine32_2.18-22~rc0_i386.deb wget http://packages.deepin.com/deepin/pool/non-free/d/deepin-wine/deepin-wine32-preloader_2.18-22~rc0_i386.deb wget http://packages.deepin.com/deepin/pool/non-free/d/deepin-wine-helper/deepin-wine-helper_1.2deepin8_i386.deb wget http://packages.deepin.com/deepin/pool/non-free/d/deepin-wine-plugin/deepin-wine-plugin_1.0deepin2_amd64.deb wget http://packages.deepin.com/deepin/pool/non-free/d/deepin-wine-plugin-virtual/deepin-wine-plugin-virtual_1.0deepin3_all.deb wget http://packages.deepin.com/deepin/pool/non-free/d/deepin-wine-uninstaller/deepin-wine-uninstaller_0.1deepin2_i386.deb wget http://packages.deepin.com/deepin/pool/non-free/u/udis86/udis86_1.72-2_i386.deb wget http://packages.deepin.com/deepin/pool/non-free/d/deepin-wine/deep

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。