关于手部姿态估计的资料好少,那我就自己来整理一下吧
参考文献:《Hand Pose Estimation: A Survey》
Abstract
近年来,深度卷积神经网络(CNNs)在几乎所有计算机视觉任务中的成功,以及低成本消费者深度相机的普及,使得手部姿态估计成为计算机视觉领域的一个热门话题。
1.Introduction
手部姿态估计如果按照时间线来分,我们可以以CNN为分界线来描述。在深度学习热潮出现之前,手部姿态估计主要使用传统机器学习和计算机视觉的方法,之后是使用深度学习来解决。早前那一波热潮是因为Kinect一代的发布,引起了Kinect应用的研究热潮,手势姿态估计就是其中的一个应用。如果大家去看那些年的论文可以发现:时间在10-14年之间的论文基本是采用机器学习方法,如随机森林,输入图像为depth。时光飞逝,岁月如梭,时间就如手里的沙子……咳咳画风不对,回来回来。就这样深度学习热潮爆发了,计算机视觉迎来了全新的纪元,手部姿态也翻开了崭新的篇章!随着CNN兴起、计算机硬件算力的提升、消费级相机的普及、数据集的增多,手部姿态估计进入以深度学习为依托的时代。
相比于早期,精度提升、处理能力增强了、应用广泛,输入的图像数据也越来越多元化:depth、RGB、RGB-D。当然还是video,但是video处理起来也是一帧一帧的RGB图像,所以把它算作RGB。研究者们也不再满足于在二维图像中回归姿态,3D的手部姿态估计也取得了长足稳定的发展,并且在至今仍保持自己的热点地位。
得益于以上的工作,姿态估计的应用越来越广泛,关于手部姿态估计的一些设想也有了实现的