2020.10.31组会汇报

最新推荐文章于 2024-09-19 08:38:20 发布

循香而落

最新推荐文章于 2024-09-19 08:38:20 发布

阅读量979

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_48648760/article/details/109426044

版权

情况如下
精度文献3篇
1、基于深度强化学习的四足机器人运动控制发展现状与展望
2、智能巡检机器人的现状与发展趋势
3、基于近端策略优化算法的四足机器人步态控制研究

深度强化学习

深度学习方法与传统强化学习方法 ( reinforcelearning ，ＲL ) 中的 Q 学习方法相结合提出了深度Q网络。
DQN 训练过程中，采用了经验回放机制，通过与环境交互获得存储记忆，在通过深度卷积网络近似当前动作值函数Q 的同时，采用一个结构相同的网络保存 N 个时间步之前的动作值函数 Q 的参数，称为目标 Q 网络
创新点的提出：基于值函数的深度强化学习方法与基于策略梯度的深度强化学习相结合的演员评论家( actor-critic，AC ) 算法，则可以发挥两者的优势，既可以汲取策略梯度的高效学习与适应连续动作空间的优点，又可以兼具基于值函数的方法高效稳定的特点并应用于四足机器人的运动控制。

巡检机器人的现状与发展趋势

提出当前巡检机器人的不足
提出功能上人机交互效果不佳
外形设计影响操作运行和机器人功能分布
审美上缺少美观性和视觉舒适度
人机交互不理想
不能满足市场的个性化需求
最后提出设计发展趋势
1、造型功能优化
2、色彩审美优化
3、关键技术优化

3.近端策略优化算法的四足机器人步态控制研究

研究难点：足式机器人步态控制
采用应用强化学习让机器人自主学习策略
创新点：将近端策略优化算法用于四足机器人步态控制，并与其他深度强化学习算法进行了对比分析．仿真实验结果表明，近端策略优化算法在实际应用中具有更好的训练效果

循香而落 CSDN认证博客专家 CSDN认证企业博客

码龄4年

32: 原创

4万+: 周排名

67万+: 总排名

8万+: 访问

: 等级

606: 积分

1531: 粉丝

58: 获赞

7: 评论

426: 收藏

私信

关注

热门文章

最新评论

D*算法
Mr.Winter`: 用ROS、Matlab、Python复现了一下D*算法，可以参考：https://blog.csdn.net/FRIGIDWINTER/article/details/129339907
裁剪DEM高程数据
邹嘉鑫: global mapper 中的裁剪方法真有效。
C语言学习笔记(2)
初学C的小白: 作者你好我想问一下文章中的整型变量的字节是不是因为操作系统的位数不同导致产生了差异呢？我的是64位系统 int是4个字节大的
MATLAB绘制三维地图
Lawrenceee: 你好，请教一下第一幅图中的地形函数是什么呀？
2020.10.31组会汇报
不正经的kimol君: 好文，鉴定完毕！

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。