基于肤色检测和卷积神经网络的手语动作识别

最新推荐文章于 2023-11-24 22:54:50 发布

会编程的汤姆猫

最新推荐文章于 2023-11-24 22:54:50 发布

阅读量1k

点赞数 5

分类专栏： CNN 文章标签：计算机视觉神经网络机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_44852954/article/details/112893806

版权

CNN 专栏收录该内容

1 篇文章 1 订阅

订阅专栏

项目文件：

项目文件列表如下：

data：存放采集的数据。
dataset:存放Train_model_tensorflow.py训练的数据。
model：存放在网络训练中表现好的模型。
Collect.py：采集界面。
Data_to_NPZ.py：图片转.npz文件。用来制作数据集。
Frame.py：UI界面。使用Python的PyQt5进行设计。
Gesture_CNN.py：实时手语动作识别。将摄像头实时获取的帧图片送入已训练好的CNN模型中判断其手语动作。
Main.py：主界面。
SaveGesture.py：采集数据。利用OpenCV获取帧图像并转为.npz文件（.npz文件是数据训练的格式）
Train_model_tensorflow.py：模型训练，采用AlexNet结构。TensorFlow=1.4.0
Translate.py：手语识别界面。
Data_rename:图片批量重命名。
项目文件已经上传至我个人的Github，有需要的可自行下载。
Github

项目内容：

内容简介

项目设定可以识别5种手语动作，大家可根据自己的需求增减动作的种类，但是程序可能需要改动一些地方。采用的数据集是自己采集的。

A动作 2.B动作 3.C动作 4.D动作 5.F动作

同时，项目准备对图像不进行肤色检测，即不对数据进行预处理，直接进行训练。采用的数据集是ASL Alphabet。ASL数据集包含 87，000 张图像，即 200x200 像素，总共有29个类。
ASL
ASL
整体的界面设计是利用PyQt5进行设计的，主要是因为PyQt5开发迅速，学习成本低，界面预览如下。
主界面
采集界面

肤色检测

别的大佬解释肤色检测的基本原理更为详细，这里不做赘述。（下图为项目实现的肤色检测）
肤色检测
肤色检测前

肤色检测后

卷积神经网络

这个项目采用的是CNN经典模型的AlexNet，大家可以参考AlexNet设计者对AlexNet的分析。（论文链接如下）
ImageNet Classification with Deep Convolutional Neural Networks

测试结果

具体测试还得回学校用高端机训练，笔记本过于乐色，训练太慢！！！

未来期望

用YOLO代替肤色检测，解决了当人物离摄像头较远时肤色检测失效的问题，能够增强整体的鲁棒性。
这个项目只适用于静态手语动作的识别，而现实生活中更多的是动态的手语动作，希望大家在这个项目的基础之上能够加入时间序列，实现动态手语动作的识别。

总结：

这篇文章是我在寒假做大创的过程中突然想写的，这也是我第一次写这么正式的博客，可能中间有许多的漏洞，希望大家能多多指正。

会编程的汤姆猫

关注

5
点赞
踩
9

收藏

觉得还不错? 一键收藏
8
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 8

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。