研究思路多是要么关注利用冗余信息提高检测速度,要么融合连续帧之间上下文信息提高检测质量。
21/1/14 下午4:07
学长建议:
图像预处理:直方图均衡化、图像亮度增强、去噪
输入图像的范围:是否需要全图
手离相机的距离:手部的分辨率、调研其他人的人手关键点检测方法
尝试各种姿态,找找哪一种情况比较好用
自己训练模型自己定义姿态
现象:如果将自己摄像头的照片进行手势识别,那么效果还是很好的
但是一旦在视频中(FPS设置为1),手势识别和分类都非常的差。
1、是否是像素问题:
对于demo的照片:480640
feed:240320
对于自己电脑摄像头的大小也是:480*640
因此判定跟像素无关
((视频的像素不等于照片像素
2、是否是FPS的问题:
我用软件方式进行FPS的调节,发现当FPS=30 和FPS=1 的时候识别和分类改善得不是很大。
视频特点:
对于手心的卷曲的识别比伸直好
伸直的手指一般总是识别出不来
对于竖大拇指识别效果是最好的,但是如果手指弯曲效果类似I love you 和 vectory很容易混淆,其原因还是伸直的手指识别效果很差
对于节点、网络、SVM三种方式在三种都不好的情况下SVM最差。
思考:我觉得并不是卷曲识别得好,应该还是噪声比较多,识别总是扭曲在一堆
对于分类问题:
1、如果可以排除上面非噪声影响,弯曲比伸直识别的好,那么各个卷曲程度的比重可以倾斜,分组实验确定