![](https://img-blog.csdnimg.cn/20201014180756925.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
强化学习
文章平均质量分 79
三丿十
电子科技大学 机器人学硕士
展开
-
【强化学习基础篇-1】Q-Learning
在本篇博客中,我们将介绍强化学习中的经典算法Q-Learning。Q-Learning是一种基于值函数的强化学习算法,用于估计在某一状态下采取某一动作的预期累积奖励。Q-Learning通过不断更新Q值函数,逐步改进策略,最终收敛到最优Q值函数。原创 2024-06-26 15:28:58 · 668 阅读 · 0 评论 -
【MUJOCO学习计划-2】深入解析MuJoCo Python接口:功能与实例
MuJoCo(Multi-Joint dynamics with Contact)是一款用于精确模拟物理交互的高级工具。它的Python接口提供了丰富的功能,使得在科学研究和机器人技术开发中的应用成为可能。MuJoCo的Python接口为用户提供了强大的功能来创建和分析复杂的物理模拟。通过熟悉其各种函数,用户可以在机器人学、仿生学和其他领域进行高效的模拟和研究。原创 2024-02-02 11:02:53 · 1113 阅读 · 0 评论