深度学习17-机器人技术中的强化学习

本文探讨了将强化学习应用于机器人技术,通过介绍简单的物理传感器和组件构建低成本机器人,并利用RL方法进行控制。讨论了机器人组成部分如开发板、传感器、伺服电机等,以及面临的硬件限制。还提及了在创建低级机器人模型并封装到Gym环境时所遇到的复杂性和挑战,如PyBullet库的使用问题、物理模拟和模型定义等。
摘要由CSDN通过智能技术生成

### 机器人技术中的强化学习

▪  这是尝试超越模拟环境进军物理世界的唯一章节。
▪  在本章中,将使用易于获得且价格便宜的组件构建一个小型机器人,并使用RL方法对其进行控制。

#### 机器人与机器人学

▪  具有两种状态(打开和关闭)的简单按钮:在简单情况下检测与对象的物理接触时,这会是一种非常流行的解决方案。例如,3D打印机通常具有所谓的挡块,挡块只是在运动部件达到某些边界限制时触发的按钮。发生这种情况时,内部软件(也称为固件)会对此事件做出反应,例如,停止发动机。
▪  距离传感器:这些距离传感器使用声波或激光测量前方物体到传感器的距离。例如,扫地机器人通常具有“悬崖探测器”,以防止自己掉下楼梯。这只是一个激光距离传感器,可测量到机器人下方地板的距离。如果该距离突然变大,则机器人会知道前进是危险的,从而做出适当的反应。
▪  光学雷达(LiDAR)传感器:这是距离传感器的更复杂和更昂贵的版本,不同之处在于传感器会旋转,因此会不断在水平面上扫描物体。传感器的输出是由一个个点构成的流(所谓的“点云”),显示了机器人与周围障碍物的距离。LiDAR在自动驾驶汽车中非常流行,因为它们提供了有关障碍物的可靠信息流,但是由于复杂的机械结构和光学结构,它们非常昂贵。
▪  摄像头:此类传感器以与现代智能手机相同的方式用流传输视频,但是流通常必须由机器人的软件进行处理以检测诸如拐角或猫之类的物体。视频处理的计算量非常巨大,因此必须使用专用硬件,例如嵌入式图形处理单元或其他神经网络加速器。好消息是,摄像头的价格可能非常便宜,并且可以提供外界的丰富信息流。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

五百五。

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值