点击我爱计算机视觉标星,更快获取CVML新技术
今天跟大家分享一篇来自微软亚洲研究院新出并已经开源的3D姿态估计的文章:Cross View Fusion for 3D Human Pose Estimation,大幅降低了3D姿态估计的误差。
在H36M数据集上,MPJPE(关节点误差均值)从之前最好结果的52mm直降到26mm,可谓大幅改进,相信该算法必将成为该领域重要参考。
该文作者信息:
该文作者来自中国科技大学、微软亚洲研究院(MSRA)、图森科技,主要为第一作者Haibo Qiu在MSRA实习期间的工作。
主要改进点
作者在该文中研究的是计算3D人体关节点的绝对值,即在场景中关节点的3D世界坐标(x,y,z),以mm(毫米)为单位的三个坐标尺度。
通常的做法是对于不同的视图(即不同角度摄像头拍摄的图像),分别进行2D姿态估计,然后从多个摄像头的2D人体姿态计算3D人体姿态(如使用Pictorial Structure Model方法)。
作者并没有打破这一整体思路,只是认为不仅在计算3D姿态时,不同视图可以相互参考,在各自独立计算2D姿态时,也可以进行跨视图的特征融合(Cross View Fusion )。
如下图: