论文: Recurrent Network Models for Human Dynamics
论文地址:
通过对mocap数据集以及视频的学习,基于作者提出的Encoder-Recurrent-Decoder(ERD)model,实现对人物运动的分类以及预测。这里重点讨论针对mocap数据集的训练以及结果。
Background (论文背景)
Multilayer LSTM Model
作者提出的模型Encoder-Recurrent-Decoder(ERD)model其实相当于LSTM model的基础上做了扩展,添加了encoder和decoder。因为通过实验发现非线性encoder和decoder十分重要,LSTM model在很短时间后就无法生成正确的运动预测值。
Gaussian Processes
作者提到另外一种方式预测运动可以通过概率模型,例如Hidden Markov Models等,但是这些方法无法应用于数据集很大的情况下。而作者的模型是通过有监督,可调参的训练方法,适用于数据集很大的情况下。