Abstract
人体图形表现出复杂而丰富的非线性和时变的动态行为。然而,大多数关于跟踪和合成图形运动的工作要么采用简单、通用的动态模型,要么采用高度特定的手工定制模型。近年来,在动态贝叶斯网络(DBNs)的框架下,已经成功地构建了一类针对时间序列模型的学习和推理算法。本文介绍了一种新的基于DBN的开关线性动态系统(SLDS)模型,并介绍了其在图形运动分析中的应用。我们的方法的一个关键特征是一种近似维特比推断技术,以克服混合状态dbn中精确推断的困难。我们给出了从视频数据中学习图形动态的实验结果,并显示了使用学习到的模型进行跟踪、插值、合成和分类的有希望的初始结果。
本文探讨了从观察状态空间轨迹的训练语料库中学习动态模型的替代方法。在有足够的训练数据的情况下,学习方法保证了灵活性和通用性。在动态贝叶斯网络(DBNs)的框架下,可以构建广泛的学习算法。DBNs推广了两种著名的信号建模工具:用于连续状态线性动态系统(LDS)的卡尔曼滤波器[1]和用于离散状态序列分类的隐马尔可夫模型(HMMs)[20]。
DBN框架提供了两个不同的好处:首先,可以在一个框架中使用直观的吸引人的图形表示法来概念化各种建模方案(参见图1)。其次,从BN文献中广泛的精确和近似统计推理和学习技术语料库可以应用于动力系统。特别是,LDSs中的估计和HMMs中的推理是dbn中推理的特殊情况。
本文的重点是关于DBN模型的一个子类,被称为开关线性系统[2,22,14,8,19]。直观地说,这些模型试图描述一个复杂的非线性动态系统,由一系列的线性模型,由一个开关变量索引。
本文有两项贡献。首先,我们演示了SLDS框架在图形动力学建模中的应用。特别地,我们演示了从视频数据中学习额平行行走和慢跑运动的切换模型。我们演示了这些学习模型在分割和跟踪任务中的应用。其次,我们推导了一个混合状态版本的维特比近似算法的推理在dbn。我们的结果证明了SLDS方法在可视化动力学建模方面的前景。
我们的结果证明了SLDS方法在可视化动力学建模方面的前景。
我们介绍了一种基于切换线性模型的动态学习的新方法。我们提出了一种克服了精确推理的指数复杂度的维特比近似技术 。这种方法的一个开放问题是缺乏对近似误差的精确界限。这是贪婪维特比式近似以及马尔可夫链蒙特卡罗方法[18]的一般问题。一种可能的替代方法是在[8,19]中使用的变分推理技术,它确实有明确定义的错误边界。
[1] B. D. O. Anderson and J. B. Moore, Optimal fifiltering . Englewood Cliffs, NJ: Prentice-Hall, Inc., 1979.
[17] R. M. Neal and G. E. Hinton, “A new view of the EM algorithm that justififies incremental and other variants,” in Learning in graphical models (M. Jordan, ed.), pp. 355–368, Kluwer Academic Publishers, 1998.
[18] R. M. Neal, “Connectionist learning of belief networks,” Ar tifificial Intelligence , pp. 71–113, 1992.
[8] Z. Ghahramani and G. E. Hinton, “Switching state-space models.” submitted for publication, 1998.
[19] V. Pavlovic, B. Frey, and T. S. Huang, “Time-series classifification using mixed-state dynamic Bayesian networks,” in CVPR , pp. 609–615, June 1999.
[20] L. R. Rabiner and B. Juang, Fundamentals of Speech Recognition . Englewood Cliffs, New Jersey, USA: Prentice Hall, 1993.