0 Abstract
局部时空特征能够在视频中捕获局部时间,同时能够适应大小、频率和移动模式的速度。在这片文章中我们阐述如何使用这些特征去识别复杂的移动模式。我们在局部时空特征的序列中构造视频表述,同时整合这些表述通过SVM分类器以达到识别目的。为了实现这样的结果,我们使用一个新的视频数据库,包含25个人在4个不同场景下的6种行为。行为识别的结果证明了提出的方法的有效性,同时验证了它比其它相关行为识别方法具有的优点。
像监控,视频恢复和人机交互的应用都要求在各种各样的场景下识别人体行为。典型场景有混乱场景,移动背景,非平稳相机、多尺度变化、人的衣服和外观的独立变化,灯光变化和视点变化等,以上这些都是计算机视觉存在的难题。
1 Representation
为了表示运动模式,我们使用局部时空特征,这可以被认为是与非恒定运动时刻移动的二维图像结构对应的原始事件。
在图像序列中检测局部特征。其基本思路是:把视频看做三维的函数,寻找一个映射函数,将三维视频的数据映射到一维空间中,然后通过求此一维空间的局部极大值的点,这些点就是时空域中的兴趣点。计算过程如下图:
在图像序列中时空域上的兴趣点包含有运动信息和动作外观信息,为了捕获这些信息,使用jets描述特征,它是计算时空兴趣点一次到四次偏导数,组合成一个34维特征向量。最后使用K-means对这些特征向量进行聚类,距离计算采用马氏距离。
2 Classification:Support Vector Machines(SVM)
对于直方图特征,用K(x,y)。
对于局部特征,用KL(Lh,Lk)。
用了两个核计算,采用最近邻完成分类。
3、Result
局部特征+SVM识别率最高,局部特征具有尺度不变性,对于复杂不稳定的背景具有鲁棒性。
对于每种方法,用来训练的视频数量越多,识别率越高。
对于直方图特征,SVM比NNC效果好。
论文原文并没有下载,大家可以上豆丁上去看。请原谅我渣渣的译文,如有错误,还望大家指正。