论文笔记 Exploration for Reinforcement Learning

最新推荐文章于 2022-11-24 12:11:40 发布

gorilla1211

最新推荐文章于 2022-11-24 12:11:40 发布

阅读量321

点赞数

分类专栏：论文笔记文章标签：深度学习

本文链接：https://blog.csdn.net/weixin_40247273/article/details/107683737

版权

论文笔记专栏收录该内容

8 篇文章 0 订阅

订阅专栏

摘要

本文定义并强调了在强化学习背景下的安全探索（safe exploration）问题。安全的概念和将导致毁坏因而必须避免的状态与转移有关。本文介绍了用来确定一个状态安全度的安全函数，与一个可以将系统从严峻状态变回安全状态的备份策略（backup policy）。本文还展示了一个分级探索（level-based exploration）方案，它可以生成一个综合的观察基础（comprehensive base of observation），同时支持安全约束。本文在一个燃气轮机的简化仿真上评估提出的方法。

主要是讲防止真实世界交互带来的物理毁坏，貌似和Minecraft世界的探索没有太大关系？

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

gorilla1211

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
论文笔记 Exploration for Reinforcement Learning

摘要本文定义并强调了在强化学习背景下的安全探索（safe exploration）问题。安全的概念和将导致毁坏因而必须避免的状态与转移有关。本文介绍了用来确定一个状态安全度的安全函数，与一个可以将系统从严峻状态变回安全状态的备份策略（backup policy）。本文还展示了一个分级探索（level-based exploration）方案，它可以生成一个综合的观察基础（comprehensive base of observation），同时支持安全约束。本文在一个燃气轮机的简化仿真上评估提出的方法。
复制链接

扫一扫