摆：倒立摆问题（连续控制）-Pendulum-v0

资源存储库

已于 2024-01-11 20:48:44 修改

阅读量454

点赞数 7

文章标签： python

于 2023-12-17 11:13:32 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/wq6qeg88/article/details/135042364

版权

在这里插入图片描述
cart pole

import gym
GAME = 'Pendulum-v0'
env = gym.make(GAME)
N_S = env.observation_space.shape[0]
print("状态空间的维数：", N_S)  # 3
N_A = env.action_space.shape[0]
print("动作空间的维数：", N_A)  # 1
A_BOUND = [env.action_space.low, env.action_space.high]
print("动作的下限：", env.action_space.low)  # [-2]
print("动作的上限：", env.action_space.high)  # [2]

目标（连续控制）

摆以随机位置开始，目标是将其向上摆动，使其保持直立。
目标是保持零角度（垂直），旋转速度最小，力度最小
在这里插入图片描述

状态空间（State） & 观察（Observation）

θ==theta ，θ在【− π，π】之间
状态空间 : 三维
cos(theta) ：【-1,1】
sin(theta)：【-1,1】
theta angular acceleration ：【-8,8】，即theta dot
在这里插入图片描述
杆的角度和角速度

动作空间（Action）

动作空间 : 1维
动作的物理含义：电机的控制力矩，且有最大值和最小值的限制
Action ：【-2,2】
在这里插入图片描述

奖励（Reward）

costs = angle_normalize(th) ** 2 + .1 * thdot ** 2 + .001 * (u ** 2)
Reward=−cost

−cost：
在这里插入图片描述
（1）角度越小越好，最理想的情况是垂直（角度为0）
（2）角加速度越小越好
（3）动作越少越小越好
是一个各回合震荡上升的曲线

截图

在这里插入图片描述

资源存储库

关注

7
点赞
踩
8

收藏

觉得还不错? 一键收藏
打赏
0
评论
摆：倒立摆问题（连续控制）-Pendulum-v0

theta angular acceleration ：【-8,8】，即theta dot。动作的物理含义：电机的控制力矩，且有最大值和最小值的限制。摆以随机位置开始，目标是将其向上摆动，使其保持直立。目标是保持零角度（垂直），旋转速度最小，力度最小。θ在【− π，π】之间归一化。杆的角度和角速度。
复制链接

扫一扫

资源存储库 CSDN认证博客专家 CSDN认证企业博客

码龄8年

576: 原创

1954: 周排名

2251: 总排名

38万+: 访问

: 等级

1万+: 积分

6443: 粉丝

5469: 获赞

17: 评论

5307: 收藏

私信

关注

热门文章

分类专栏

最新评论

【论文笔记1】【DDQN】【双深度Q网络】
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
【requirement.txt】【environment.yaml】的生成与使用
2301_79946795: 你好，请问一下把mappo环境配置到conda虚拟环境后，这一步是不是必须要进行，因为我只把on policy解压cd on-policy pip install -e.后pip list ，发现和官方开源的环境很多都不一样？
【VirtualBox】【启动虚拟机报错】
m0_69371469: 我也是这样，请问你解决了吗
【VirtualBox】【启动虚拟机报错】
LndAaron: 具体是在哪里打开的呀，我以管理员身份运行也不行
【VirtualBox】【启动虚拟机报错】
洛漓914: 我把那个设置为管理员权限打开了

最新文章

2024

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

资源存储库 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。