强化学习入门(Matlab2021b)-创建环境【1】

最新推荐文章于 2024-06-12 09:47:57 发布

余加木

最新推荐文章于 2024-06-12 09:47:57 发布

阅读量1.1k

点赞数 11

分类专栏：强化学习[Matlab] 文章标签：人工智能深度学习 matlab 机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zjh2883/article/details/136184422

版权

目录

前言
强化学习环境(Environment)简介
参考连接

前言

本文介绍如何基于MATLAB编写step、reset函数，创建自己的强化学习环境(Environment)。

使用 rlFunctionEnv 函数，可以根据观察(observation)规范、动作(action)规范和自己创建的step、reset函数创建 MATLAB 强化学习环境，并可以在此环境中训练强化学习智能体(agent)。

对于更复杂的环境，可以使用模板类创建环境对象。

强化学习环境(Environment)简介

environment建立了与agent存在交互的外部系统模型，在该环境中训练agent完成任务。

在控制系统应用中，该外部系统通常称为plant。environment中包含可能需要获取的任何参考信号的环境变量。

强化学习框架

agent和environment交互序列以离散时间步数表示：

给定时间步 $t$ ，environment的state为 $S (t)$ ，产生的observation为 $O (t)$ ；基于 $O (t)$ 和自身策略函数，agent得到的action为 $A (t)$ 。
基于 $S$

最低0.47元/天解锁文章

关注

11
点赞
踩
22

收藏

觉得还不错? 一键收藏
打赏
0
评论
强化学习入门(Matlab2021b)-创建环境【1】

本文介绍如何基于MATLAB编写step、reset函数，创建自己的强化学习环境(Environment)。Environment建立了与agent存在交互的外部系统模型，并在该环境中训练agent完成任务。
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

余加木 想喝蜜雪冰城柠檬水(≧≦)/

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。