DMP学习笔记
文章平均质量分 79
在路上的zmm
SDU研究生在读
展开
-
DYNAMIC MOVEMENT PRIMITIVES PART 1: THE BASICS
参考资料链接: DMP:DYNAMIC MOVEMENT PRIMITIVES.长期以来,复杂的动作一直被认为是由一系列按顺序或并行执行的原始动作构建块组成的,而DMPs是这些原始动作的一种拟议的数学形式化。DMP与先前提出的构件的区别在于,每个DMP都是一个非线性动力学系统。基本思想是,你拿一个具有明确的,稳定行为的动力系统,加上另一个术语,使它在运行过程中,遵循一些有趣的轨迹。dmp有两种:离散型和节奏型。对于离散的运动,基本系统是一个点吸引器,而对于有节奏的运动,则使用极限环。在这篇文章中,我们只关翻译 2020-11-13 12:09:08 · 1238 阅读 · 1 评论 -
dmp_boo_robot学习笔记
参考资料:https://github.com/stulp/dmpbbo/blob/master/demo_robot/README.md如何逐步训练和优化一个真正的机器人上的DMP原创 2020-08-23 13:47:08 · 771 阅读 · 0 评论 -
Black Box Optimization of Dynamical Movement Primitives学习笔记
参考资料: https://github.com/stulp/dmpbbo前提:你已经阅读了黑盒子优化和动态运动原语的教程。在将BBO应用于策略改进时(例如优化机器人上的DMP),“rollout”的概念变得很重要。rollout是使用一组策略参数(例如DMP的参数)执行策略(例如DMP)的结果。虽然优化的搜索空间是在策略参数的空间中,但成本是由rollout决定的。从实现的角度来看,将BBO应用于策略改进(可能会执行dmp)需要几个扩展:1.并行运行多个优化,针对DMP的每个自由度运行一个优化2原创 2020-08-19 21:59:31 · 396 阅读 · 0 评论 -
Black Box Optimization学习笔记
本页面解释了黑箱成本函数优化的进化策略的实现。在这种情况下,黑盒意味着不能对代价函数做任何假设,例如,我们不能得到它的导数,我们甚至不知道它是否是连续的。已经实现的进化策略都是基于**奖励加权平均(又名概率加权平均)**的,正如本文/演示中所解释的:http://icml.cc/discuss/2012/171.html这里有一个1页的算法描述: http://www.pyoudeyer.com/stulpOudeyerDevelopmentalScience17.pdf#page=30基本算法如下翻译 2020-08-19 21:17:53 · 535 阅读 · 0 评论 -
Dynamical Systems和Function Approximation笔记
参考资料:DMP代码库(https://github.com/stulp/dmpbbo)原创 2020-08-15 21:04:51 · 283 阅读 · 1 评论