Dynamical Movement Primitives (DMP) 总结

zzzzzzzzzzhy

已于 2022-10-26 23:54:31 修改

阅读量591

点赞数

分类专栏： Paper总结文章标签：人工智能动态规划算法

于 2022-10-26 23:51:12 首次发布

本文链接：https://blog.csdn.net/zzzzzzzzzzhy/article/details/127542941

版权

Paper总结专栏收录该内容

3 篇文章

订阅专栏

本文总结了Dynamical Movement Primitives (DMP)，它通过弹簧阻尼系统与非线性控制项实现对示教数据建模，提供了简单的非线性系统建模方法，还利用相位系统动态调节控制量大小。文章介绍了多维动态系统变量耦合方式，以及通过最小化损失函数学习系统参数。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

Dynamical Movement Primitives (DMP) 总结

概述

DMP通过将动态系统建立为①弹簧阻尼系统+②非线性控制项的方式 $f$ ，实现了对示教数据的建模。具体贡献如下：

① 提供了一种简单的非线性系统建模方法：

$\tau \ddot{y} = \alpha(\beta(g-y)-\dot{y})+f(x),$ $\tau \dot{x} = f_1(x)$

通过将控制量 $f$ 设计为隐式包含时间的非线性函数来实现系统的非线性性。

② 创新性地提出了利用一个相位系统，也称为标称系统(canonical system)来动态调节控制量 $f$ 的大小:

$\tau \dot{x} = -\alpha_x x,$ 显然 $x$ 在原点处渐进稳定。通过将 $x_0$ 设定为1,代表系统刚开始运行， $x_{\infty} = 0$ 代表系统结束，来隐式地表示时间 $t$ 。
文章将控制量 $f$ 设计为以下函数:
$\frac{\sum_{i=1}^{N}{\Phi_i(x)\omega_i}}{\sum_{i=1}^{N}\Phi_i(x)}x(g-y_0),$ $\Phi_i(x) = \exp{-\frac{1}{2 \sigma_i^2}(x-c_i)^2}$
其中 $\Phi_i(x),i=1,...,N$ 代表基函数， $\omega_i$ 为待学习的参数， $g$ 为示教数据的目标点， $y_0$ 为起始点， $x$ 为相位系统的变量。
可以看出，当 $t\to \infty$ 时， $x\to 0$ ， $f\to 0$ ，这表示随着系统的轨线接近目标点，控制量 $f$ 越来越小，最终收敛到0.

注意到，在需要建模含有极限环的非线性系统时，只需要将控制量 $f$ ,基函数 $\Phi_i(x)$ 变为周期函数:
$\tau \dot{\phi} = 1,$ $\frac{\sum_{i=1}^{N}{\Phi_i\omega_i}}{\sum_{i=1}^{N}\Phi_i}r,$ $\Phi_i=\exp({h_i(\cos(\phi-c_i)-1)}$ 就可以描述非线性系统中极限环的行为。

多维动态系统

请添加图片描述
如上图所示，文章通过同一相位系统，不同的非线性控制项 $f$ 以及不同的弹簧阻尼系统来进行不同维度之间变量的耦合。

系统参数的学习

给定示教数据 $(y_{demo}, \dot{y}_{demo}, \ddot{y}_{demo})^k, k=1,2,...,P$ ，若构建含有单一收敛子的系统，则选定 $y_0=y_{demo}^1,g=y_{demo}^P$ .时间常数 $\tau$ 选择为示教轨迹记录时常的1.05倍。
将方程改写为
$f_{target} = \tau \ddot{y} -\alpha(\beta(g-y_{demo})-\dot{y}_{demo})$ 设计损失函数为 $\frac{1}{2}(f_{target}-f(x))^2$ 通过最小化损失函数来得到 $c_i,\sigma_i,\omega_i$ 。