手部姿态估计综述

最新推荐文章于 2024-06-27 23:34:37 发布

sxxblogs

最新推荐文章于 2024-06-27 23:34:37 发布

阅读量5.5k

点赞数 9

分类专栏：姿态估计文章标签： python 计算机视觉机器学习人工智能

本文链接：https://blog.csdn.net/sunnyblogs/article/details/112539600

版权

本文概述了手部姿态估计的发展，从早期的机器学习方法到深度学习的广泛应用，特别是在游戏、AR/VR和智能驾驶等领域。重点讨论了深度学习中的基于检测和回归的方法，以及Monocular Real-time Hand Shape and Motion Capture using Multi-modal Data论文中的实时三维手部姿态捕捉技术。此外，还介绍了一种采用多任务信息共享的CrossInfoNet网络，用于增强手部姿态估计的性能。

摘要由CSDN通过智能技术生成

关于手部姿态估计的资料好少，那我就自己来整理一下吧
参考文献：《Hand Pose Estimation: A Survey》

Abstract

近年来，深度卷积神经网络(CNNs)在几乎所有计算机视觉任务中的成功，以及低成本消费者深度相机的普及，使得手部姿态估计成为计算机视觉领域的一个热门话题。

1.Introduction

手部姿态估计如果按照时间线来分，我们可以以CNN为分界线来描述。在深度学习热潮出现之前，手部姿态估计主要使用传统机器学习和计算机视觉的方法，之后是使用深度学习来解决。早前那一波热潮是因为Kinect一代的发布，引起了Kinect应用的研究热潮，手势姿态估计就是其中的一个应用。如果大家去看那些年的论文可以发现：时间在10-14年之间的论文基本是采用机器学习方法，如随机森林，输入图像为depth。时光飞逝，岁月如梭，时间就如手里的沙子……咳咳画风不对，回来回来。就这样深度学习热潮爆发了，计算机视觉迎来了全新的纪元，手部姿态也翻开了崭新的篇章！随着CNN兴起、计算机硬件算力的提升、消费级相机的普及、数据集的增多，手部姿态估计进入以深度学习为依托的时代。

相比于早期，精度提升、处理能力增强了、应用广泛，输入的图像数据也越来越多元化：depth、RGB、RGB-D。当然还是video,但是video处理起来也是一帧一帧的RGB图像，所以把它算作RGB。研究者们也不再满足于在二维图像中回归姿态，3D的手部姿态估计也取得了长足稳定的发展，并且在至今仍保持自己的热点地位。

得益于以上的工作，姿态估计的应用越来越广泛，关于手部姿态估计的一些设想也有了实现的