Learned Motion Matching 论文精读

最新推荐文章于 2025-04-29 12:24:11 发布

弥鹤

最新推荐文章于 2025-04-29 12:24:11 发布

阅读量1.3k

点赞数 16

分类专栏：论文学习文章标签：论文阅读论文笔记

本文链接：https://blog.csdn.net/Maryart/article/details/141001476

版权

论文学习专栏收录该内容

1 篇文章

订阅专栏

Learned Motion Matching 原文链接

Basic Infomation基本信息

论文题目：Learned Motion Matching
作者：DANIEL HOLDEN等
年限：2020
期刊：ACM Transactions on Graphics
论文背景：使用传统的motion matching方式会占用大量的内存
文章内容：提出LMM，结合了神经网络和现有的motion matching方式，兼具了两者的优点，降低了内存消耗，且在动作质量和性能等方面都取得了良好的效果。

Motion Matching 动作匹配

动作匹配（Motiong Matching）是一种是一种用于角色动画和运动控制的方法，特别是在影视游戏和交互式应用中。它的核心思想是通过搜索一个动画数据库，找到与当前上下文最匹配的动画帧或序列，以响应用户输入或环境变化。。

在游戏和动画中，需要根据角色的即时动作或玩家的输入动态从大量数据库中搜索并生成动画。在此之前的方法是使用状态机，由美术人员进行动作切换的设计。而动作匹配能够实时地从大量预捕获的动画数据中找到并合成合适的动画片段。

然而，对于传统状态机，动画是通过状态之间的转换和预定义的动画片段来播放的，可能受限于预设的动画集，通常需要动画师手动更新状态机逻辑。然而Motion Matching可以从大量动画数据中动态生成几乎无限的动作变化，提高了动作的多样性和真实性，能够更好地适应不同的情境和环境变化。

Related Work 相关工作

数据驱动的动画合成（Data-Driven Animation Synthesis）是一种利用数据集来生成动画的技术，这种方法依赖于大量的运动捕捉数据或其他形式的运动数据集，这些数据集包含了真实或模拟的运动信息。数据驱动的方法可以非常高效，尤其是在实时动画生成方面，因为它们可以快速适应新的输入条件。尽管有很多优势，数据驱动的动画合成也面临一些挑战，如数据质量、泛化能力、计算资源和模型复杂性等。在这一方面工具繁多，包括图形、线性方法、基于核的方法以及最近的基于神经网络的方法。

动作匹配（Motion Matching）最先在2015年提出，通过搜索动画数据库来匹配当前姿势和用户轨迹。后来提出了更多其他技术与优化方案。。在实践中，动作匹配技术可以被视为数据驱动动画合成的一种实现方式或特定应用。动作匹配利用数据集中的运动数据，通过搜索和匹配过程来合成动画。

Basic Motion Matching 基本动作匹配

我们如何描述一个动作的状态呢？在基本的Motion Matching中我们使用特征向量（feature vector） $x$ 和姿势向量（pose vector） $y$ 来描述一个动作

特征向量（feature vector） $X$ 的描述如下
$x=\lbrace{t^t\quad t^d\quad f^t\quad \dot f^t \quad \dot h^t}\rbrace\in\Bbb R^{27}$
其中：

$t^t\in \Bbb R^6$ ：未来20、40和60帧角色局部投影到地面上的2D未来轨迹位置
$t^d \in \Bbb R^6$ ：未来20、40和60帧角色局部的轨迹面向方向
$f^t \in \Bbb R^6$ ：两个脚关节在角色局部的位置
$\dot{f}^t \in \Bbb R^6$ ：两个脚关节在角色局部的速度
$\dot{h}^t \in \Bbb R^3$ ：角色髋关节的速度

姿势向量（pose vector） $X$ 的描述如下
$x=\lbrace{y^ty^r\quad \dot{y}^t\dot{y}^r}\quad \dot{r}^t\dot{r}^r\quad o^*\rbrace\in\Bbb R^{27}$
其中：

$y^ty^r$ ：关节局部平移和旋转
$\dot{y}^t\dot{y}^r$ ：关节的局部平移和旋转速度
$\dot{r}^t\dot{r}^r$ ：两个脚关节在角色局部的位置
$o^*$ ：两个脚关节在角色局部的速度

那么对于每一帧i，我们都可以通过X和Y构建出一个矩阵，进而构建出一个动作匹配的数据库。

在运动匹配过程中，系统会根据用户输入和当前上下文构建一个查询向量 $\hat x$ 。这个查询向量包含了用户希望生成的动画的特征。

Basic Motion Matching算法的目标是找到匹配数据库X中与查询向量 $\hat x$ 距离最近的条目。这通常是通过计算查询向量与X中每个特征向量的欧几里得距离来实现的。距离的计算公式可以表示为：
$k^*=\underset{k}{arg min}\lVert{\hat x -x_k}\rVert^2$
一旦找到最近的匹配项，如果当前帧i与最近帧 k∗ 不匹配，动画播放将从这个最近帧开始，并通过使用如惯性化混合的技术插入平滑的过渡。这个搜索和选择过程每N帧重复一次，以确保动画的连续性和对用户输入的响应性。

在这里插入图片描述

Motion Matching的原理可以由三个阶段来描述：通过投影（Projection）将查询向量与数据库中的动画帧进行匹配，然后通过解压缩（Decompression）将查询到的动画帧映射回目标，步进（Stepping）的目标是推出下一帧动画

Projection：当用户输入的轨迹和查找到的目标 Frame 的轨迹不一致（或是差别很大），则需要重新搜索，通过用户模拟的轨迹和当前 pose 的状态在数据库中进行匹配，然后作为修正的Frame
Decompression：要把查找到的目标 Frame 重新映射回目标 Pose
Stepping：index++ 逐步推出下一个Frame