【python】基于深度学习的Web浏览器手势控制系统
**思路:**python语言开发,基于深度残差网络Kreas框架,通过建立样本库等进行手势训练,通过识别出的不同手势匹配WebDriver控制器(Selenium框架工具)来实现对Web浏览器的控制。
本文选取基于HOG+SVM和基于残差网络Resnet50的两种静态手势识别算法来着重研究。本文通过对所选的网络结构(HOG+SVM、Resnet50)进行对比分析(肯定是后者效果好 哈哈哈),实验结果表明残差结构Resnet50具备准确率更高、易优化、权值共享等优点,可以大大降低运算复杂度,本文选取基于深度残差网络Resnet50来实现Web浏览器的手势控制,对本文提出的手势识别方法进行具体的应用。手势控制浏览器实现的思路是手势匹配控制器,通过Web应用程序测试的工具(Selenium)调用运行并控制浏览器。本文中定义了八种控制手势,分别实现功能:打开Firefox浏览器、打开百度、窗口最大化、窗口还原、窗口滑到底部、打开下一页、打开上一页、关闭Firefox浏览器。经测试,给定的八种控制手势能够对浏览器进行有效的控制。
##一、建立样本库
1.人工采录手势视频,截取图片标定手势:0-10,统一分辨率
2.剔除不完整图像,防止发生过拟合
3.按4:1分为数据集(100张左右)和测试集(25张左右)
4.Python语言开发,Kreas框架(深层神经网络的深度学习库)