![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
强化学习
文章平均质量分 66
望有恒
若有恒,何必三更眠五更起;最无益,莫过一日曝十日寒!邮箱:f781716963@163.com
展开
-
远程连接服务器及可视化方法(Win和Linux)
远程连接服务器及可视化方法(Win和Linux)原创 2024-02-25 16:28:26 · 2196 阅读 · 0 评论 -
Linux:mujoco_py安装问题
mujoco_py按照流程及问题解决原创 2023-04-07 00:36:20 · 1027 阅读 · 0 评论 -
mujoco训练数据绘制
【代码】mujoco训练数据绘制。原创 2024-01-09 11:11:46 · 373 阅读 · 0 评论 -
从TensorBoard中导出数据并对其进行平滑处理
从TensorBoard中导出数据并对其进行平滑处理原创 2022-10-21 10:11:22 · 5373 阅读 · 0 评论 -
mj_loadXML error: b‘XML parse error at line 0, column 0:\nFailed to open file\n‘
此处,我是将文件路径…/resources/xz01.xml 改称 ./resources/xz01.xml ,问题成功解决。这个地方我们就要去区别./和…/的区别,往往是我们不能区别二者的使用情况,导致程序运行错误。如下图可知,其Failed to load XML file。此问题通常是文件路径出现了问题。原创 2022-10-21 08:55:16 · 1299 阅读 · 0 评论 -
安装mujoco报错:distutils.errors.DistutilsExecError: command ‘gcc‘ failed with exit status 1
如果你一开始就报错的问题的话,可以尝试官方的解决方法:翻译:因为 mojoco_py 已经编译了需要链接到提供的 mujoco 二进制文件的本机代码,所以它在 linux 上的安装可能比纯 python 源包更具挑战性。要在 ubuntu 上安装 mujoco-py,请确保安装了以下库:如果安装了上述库,但仍然显示无法找到 -1GL 的错误,则很可能需要直接创建符号链接:2、FileNotFoundError: [Errno 2] No such file or directory: ‘patchel原创 2022-07-03 09:00:31 · 1935 阅读 · 0 评论 -
mujoco_py中文文档
MuJoCo 是一个物理引擎,用于使用contacts进行详细、高效的刚体模拟。 允许使用 Python 3 中的 MuJoCo。该库已更新为与 2021 年 10 月 18 日发布的 MuJoCo 2.1 版兼容。目前支持以下平台:以下平台已弃用且不受支持:If you want to specify a nonstandard location for the package,use the env variable .要将 包含在您自己的包中,请将其添加到您的要求中,如下所示:要以交互方式使用原创 2022-07-02 00:41:30 · 4091 阅读 · 0 评论 -
mujoco+spinningup进行强化学习训练快速入门
目标:使用强化学习做力控,使机器人(UR5)平稳地运动到指定位置,并保持该状态。 action_space是由控制器的范围直接决定的,我们希望做一个力控,也就是把动作的输入直接给控制器上。acti......原创 2022-06-30 22:19:59 · 2186 阅读 · 1 评论 -
stable_baselines快速入门
baselines是OpenAI推出的一套强化学习算法组件,用于快速配置强化学习算法,对入门者比较友好。本文通过stable_baselines建立DQN框架,训练并运行倒立摆(CartPole-v0)原创 2022-06-30 22:04:44 · 2900 阅读 · 0 评论 -
Gym安装、调用以及注册
Gym的安装、调用以及注册教程原创 2022-06-30 21:52:19 · 1954 阅读 · 1 评论 -
Numpy快速入门
Numpy快速入门原创 2022-06-30 21:45:28 · 106 阅读 · 0 评论 -
Mujoco 对闭链机器人建模
Mujoco 对闭链机器人建模MuJoCo是目前机器人强化学习中最流行的仿真器,官方论坛提供了一些常见机器人的模型,但是如果其中没有自己需要的机器人模型,就只能自己建一个了。本文主要记录一下如何建立MuJoCo的闭链机器人模型。1、闭链机器人参数下面将以行者2号为例进行介绍, 行者2号参数如下:运动情况:蓝色:腿和驱动旋转;绿色:腿和交点旋转;黄色:腿和交点滑动;红色:驱动动力;参数: d= 67.5 mm;r= 15 mm;l= 1000 mm;原创 2022-05-12 20:25:34 · 662 阅读 · 0 评论 -
URDF创建
URDF创建1、URDF基本语法 URDF 文件是一个标准的 XML 文件,XML文件定义了一系列的标签用于描述机器人模型,机器人模型可能较为复杂,但URDF 中机器人的组成却是较为简单,可以主要简化为两部分:连杆(link标签) 与关节(joint标签),接下来我们就通过案例了解一下 URDF 中的不同标签:1.1 robot 根标签 urdf 中为了保证 xml 语法的完整性,使用了robot标签作为根标签,所有的 link 和 joint 以及其他标签都必须包含在 robo原创 2022-04-04 14:17:04 · 1650 阅读 · 0 评论 -
Webots入门(含Webots 2021a安装包)
Webots 2021a安装包,链接如下:链接:https://pan.baidu.com/s/1Ue-0AfDVHvsbbFvZ1KDjwA提取码:5225webots R2021a 官方教程中文翻译(一)你在webots的第一次仿真(二)修改环境(三)外观(四)有关控制器的更多内容(五)复合刚体和物理属性(六)四轮机器人(七)你的第一个原型(八)使用ROSwebots超详细教学视频传送门,走你!...原创 2022-01-13 11:52:03 · 2390 阅读 · 4 评论 -
用一个简单的例子来阐述强化学习的相关概念(二)
什么是强化学习?强化学习是Agent玩家在与环境的互动当中,为了达成目标而进行了学习过程。这是强化学习的第1层结构,称之为基本元素,包括第一Agent玩家,第二Environment环境,第三个Goal目标。强化学习的第2层结构,称之为主要元素,包括:第一State状态,第二Action行动,第三Reword奖励。最后则是强化学习的第3层结构,称之为核心元素Policy策略以及Value价值。以围棋为例,完整的梳理一下这些元素在强化学习过程中的含义,同时,我们将会了解到,强化学习与其他机器学习领域所不同原创 2022-01-11 18:59:20 · 1261 阅读 · 0 评论 -
强化学习Reinforcement Learning概念理解篇(一)
在学习强化学习之前,应该对强化学习有一个大致的了解,即去分析一下强化学习的结构或者组成元素:什么是强化学习?所谓强化学习,就是在与环境的互动当中,为了达到某一个目标而精心的学习过程,因此称之为Goal-directed learning from interaction with the environment,这其实就是强化学习的第1层结构。可将其称之为强化学习的基本元素,包括:第一Agent,第二Environment,第三Goal。其中Environment是环境,Goal是目标,与环境进行互动的主原创 2022-01-11 13:59:54 · 2306 阅读 · 1 评论