【python、SVM、HOG、Resnet】基于深度学习的Web浏览器手势控制系统

本文介绍了使用Python和深度学习(Resnet50)开发的Web浏览器手势控制系统,通过手势识别(包括HOG+SVM和Resnet50对比)控制Selenium驱动的浏览器。实验表明Resnet50在准确率和效率上更优,定义了8种手势对应不同浏览器操作,如打开、关闭、滑动等。系统实现了手势到控制指令的映射,有效控制浏览器行为。
摘要由CSDN通过智能技术生成

【python】基于深度学习的Web浏览器手势控制系统

**思路:**python语言开发,基于深度残差网络Kreas框架,通过建立样本库等进行手势训练,通过识别出的不同手势匹配WebDriver控制器(Selenium框架工具)来实现对Web浏览器的控制。

本文选取基于HOG+SVM和基于残差网络Resnet50的两种静态手势识别算法来着重研究。本文通过对所选的网络结构(HOG+SVM、Resnet50)进行对比分析(肯定是后者效果好 哈哈哈),实验结果表明残差结构Resnet50具备准确率更高、易优化、权值共享等优点,可以大大降低运算复杂度,本文选取基于深度残差网络Resnet50来实现Web浏览器的手势控制,对本文提出的手势识别方法进行具体的应用。手势控制浏览器实现的思路是手势匹配控制器,通过Web应用程序测试的工具(Selenium)调用运行并控制浏览器。本文中定义了八种控制手势,分别实现功能:打开Firefox浏览器、打开百度、窗口最大化、窗口还原、窗口滑到底部、打开下一页、打开上一页、关闭Firefox浏览器。经测试,给定的八种控制手势能够对浏览器进行有效的控制。

##一、建立样本库
1.人工采录手势视频,截取图片标定手势:0-10,统一分辨率
2.剔除不完整图像,防止发生过拟合
3.按4:1分为数据集(100张左右)和测试集(25张左右)
4.Python语言开发,Kreas框架(深层神经网络的深度学习库)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值