Motion Segmentation by Velocity Clustering with Estimationof Subspace Dimension阅读报告
任务介绍
这篇论文主要的研究是:把视频中几个运动目标的跟踪点(tracked feature points)划分为不同的类组(使用的是hopkins数据集,其中跟踪点已知,运动目标的类数k已知)。
仿射相机模型
W = M * S
W为2F * p 的矩阵,F为视频的帧数,p为跟踪点的个数。
M 为一个motion矩阵 2F * 4的矩阵
S 为struct矩阵 4 *P
噪声的减少
使用速率(velocity)代表跟踪点,即【x1-y1,y1-y2,…,xF-1 – xF, yF-1 - yF】表示跟踪点,实验表明可以很好的降低噪声的影响。
Affinity 测量
采用的是向量间的角度信息来表示相似性。
维数选择
研究表明,最好维数都在【2k, 4k】(k为视频中运动目标的个数,hopkins数据集中已知)之间,
这篇paper的思想是遍历所有的维数,然后根据均根方差(RMSE)最小选择最优的结果:
均方差:(t为注册跟踪点)
均根方差:
所有跟踪点的均根方差:
最后的分割具有最小的均根方差(RMSE);
算法步骤:
1)简要过程
输入:hopkins中某一场景的ground truth (如:cars1_truth.mat)中所有运动目标跟踪点的三维坐标
输出:跟踪点的分类结果(label)以及该算法的错分率
2)具体过程
①求出测量矩阵M(measure)
②求出场景中目标的个数:
③运动聚类分组:
关键算法:
遍历所有的维数2k 到 4k :
对于每个子空间用算出每一个聚类分组的结果,然后算出每个聚类结果的均根方差(RMSE),取最小的结果当成最后的结果
结果: