科研零碎笔记-北航科研_手部连续帧关键点-CSDN博客

本文链接：https://blog.csdn.net/Carol_learning/article/details/112548933

博客探讨了在视频手势识别中遇到的挑战，包括FPS的影响、图像预处理、手部分辨率和不同姿态的识别效果。尽管图像像素和FPS可能并非主要因素，但噪声和手指伸直状态的识别困难是关键问题。卷曲手势的识别优于伸直，可能由于噪声导致的扭曲。分类上，SVM表现相对较差。建议通过调整模型和实验不同卷曲程度的比重来优化识别效果。

摘要由CSDN通过智能技术生成

研究思路多是要么关注利用冗余信息提高检测速度，要么融合连续帧之间上下文信息提高检测质量。
21/1/14 下午4:07
学长建议：
图像预处理：直方图均衡化、图像亮度增强、去噪
输入图像的范围：是否需要全图
手离相机的距离：手部的分辨率、调研其他人的人手关键点检测方法
尝试各种姿态，找找哪一种情况比较好用
自己训练模型自己定义姿态
现象：如果将自己摄像头的照片进行手势识别，那么效果还是很好的
但是一旦在视频中（FPS设置为1），手势识别和分类都非常的差。
1、是否是像素问题：
对于demo的照片：480640
feed：240320
对于自己电脑摄像头的大小也是：480*640
因此判定跟像素无关
((视频的像素不等于照片像素
2、是否是FPS的问题：
我用软件方式进行FPS的调节，发现当FPS=30 和FPS=1 的时候识别和分类改善得不是很大。

视频特点：
对于手心的卷曲的识别比伸直好
伸直的手指一般总是识别出不来
对于竖大拇指识别效果是最好的，但是如果手指弯曲效果类似I love you 和 vectory很容易混淆，其原因还是伸直的手指识别效果很差
对于节点、网络、SVM三种方式在三种都不好的情况下SVM最差。
思考：我觉得并不是卷曲识别得好，应该还是噪声比较多，识别总是扭曲在一堆

对于分类问题：
1、如果可以排除上面非噪声影响，弯曲比伸直识别的好，那么各个卷曲程度的比重可以倾斜，分组实验确定