厉害了,利用深度学习开发人脸识别老板探测器(附源码)

原来知乎也会犯这样问题:

原文地址:

http://www.techug.com/hironsan-bosssensor?utm_source=tuicool&utm_medium=referral

知乎地址:只是题目不一样

https://zhuanlan.zhihu.com/p/24809159?utm_source=tuicool&utm_medium=referral

如果上班的时候想放松一下,或者直说想偷偷懒,看点和工作无关的网页,这时候万一老板突然出现在背后,会不会感到很难堪呢?

有的浏览器设置了boss按键,手快的人还可以切换屏幕,不过总会显得不自然,而且经常搞的手忙脚乱的。

一个日本程序员决定自己动手,编写一个一劳永逸的办法,我们来看看他是怎么实现的吧~

思路很直接:用网络摄像头自动识别在工位通道走过的人脸,如果确认是老板的话,就用一张写满了代码的截图覆盖到整个屏幕上。 整个工程中应用了Keras深度学习框架来建立识别人脸的神经网络,和一个网络摄像头用来捕捉老板的人脸。

任务是这样的

当老板接近我的工位时,电脑就会自动切换屏幕

办公室的情况如下:

厉害了,利用深度学习开发老板探测器(附源码)0

从老板的座位到我的座位大约6~7米,他会在离开座位后4到5秒钟到达我的座位,因此,需要在这之前隐藏屏幕,所以时间比较紧迫。

策略

首先需要让电脑完成对老板面部的深度学习。然后在我的办公桌上摆上一个网络摄像头,让摄像头对着通道,当网络摄像头捕捉到老板的脸时就切换屏幕。

嗯,这是一个完美的项目。先取一个好名字,就叫Boss Sensor(老板探测器)好了。

厉害了,利用深度学习开发老板探测器(附源码)1

Boss Sensor的简单结构图如下:

厉害了,利用深度学习开发老板探测器(附源码)2

处理过程分为三步:

  • 网络摄像头实时拍摄图像
  • 学习模型检测和识别所拍摄图像的人脸
  • 如果识别结果是老板则切换屏幕

所需要的技术实现只有三项:

  • 拍摄人脸图像
  • 识别人脸图像
  • 切换屏幕

一步步完成之后整合就可以了。

拍摄人脸图像

首先找一个网络摄像头,我用的是BUFFALO BSW20KM11BK摄像头,大家随便找个清晰度够的就可以了。

厉害了,利用深度学习开发老板探测器(附源码)3

最好不要用相机自带的识别软件裁剪人脸,因为后面的深度学习过程还需要处理。所以,我用Python和OpenCV编写了一段裁剪人脸图像的脚本,代码在这里下载:

https://github.com/Hironsan/BossSensor/blob/master/camera_reader.py

偷拍到的人脸图像比我之前设想的更清楚▼

厉害了,利用深度学习开发老板探测器(附源码)4

识别人脸图像

接下来,要用机器学习教会电脑识别老板的脸。

我们需要以下三个步骤:

  • 采集图像
  • 图像预处理
  • 建立机器学习模型

让我们一个接一个看一下。

采集图像

首先,需要收集大量的图片供电脑学习。一般来说有三种大量收集图片的方法:

  • 谷歌图片搜索
  • Facebook的图像采集
  • 从视频里截图

一开始,我像电影里的特工一样收集了各种搜索引擎上的老板照片,还有Facebook上老板自己上传的照片,但说实话,没有收集到足够的图像。所以,反正老板就在身边,我就简单粗暴的拍摄了一段他的视频,然后把视频分解成大量的图像。

图像预处理

现在我有很多人脸图像了,但还不能拿它们来建立学习模型,必须要裁剪掉与脸部不相关的部分。

我使用ImageMagick来提取人脸,你可以用别的图像软件来做。

总之,最后我收集了大量的人脸图像,就像这样: ▼

厉害了,利用深度学习开发老板探测器(附源码)5

估计我是全世界拥有最多老板头像的人了,肯定比他爸爸妈妈要多的多。

现在可以准备机器学习了。

建立机器学习模型

Keras框架用来建立卷积神经网络和神经网络培训。Tensorflow用来写Keras的后端。如果只识别脸部的话,可以调用一些Web API比如微软的Computer Vision API,但这次我决定自己来实现,因为这个项目需要确保实时性。

网络体系结构大体如下,Keras非常方便,它可以很轻松的输出这样的结构: ▼

厉害了,利用深度学习开发老板探测器(附源码)6

代码在这里下载:

https://github.com/Hironsan/BossSensor/blob/master/boss_train.py

至此,只要老板出现在摄像头中,我就可以识别出他来了。

切换屏幕

最后一步,很简单,学习模型识别出老板的脸之后,把电脑屏幕换掉就好了。

我是程序员,所以我准备了这样一张图:▼

厉害了,利用深度学习开发老板探测器(附源码)7

电脑上只显示这张图片,这样就可以假装我在认真工作了。

这张图需要全屏显示,所以我调用了PyQt库,代码在这里下载:

https://github.com/Hironsan/BossSensor/blob/master/image_show.py

一切工作都完成了。

成品

最后把分别实现的技术整合起来并验证,真的成功了!

“现在老板离开了座位,正走向我的工位。”▼

厉害了,利用深度学习开发老板探测器(附源码)8

“OpenCV已经检测出人脸,将人脸图像发送给学习模型。”▼

厉害了,利用深度学习开发老板探测器(附源码)9

“学习模型认出了他,屏幕自动切换。ヽ(‘ ∇‘ )ノ”▼

厉害了,利用深度学习开发老板探测器(附源码)10

源码

这就是我的Boss Sensor,全部的源码都放在github上了,可以在这里下载(也可点击“阅读原文”下载:https://github.com/Hironsan/BossSensor

总结

结合网络摄像头的实时图像采集和Keras深度学习框架,确实可以完成人脸识别。
在实践过程中,我发现OpenCV的图像精度不够高,虽然不影响识别,但我准备改用Dlib来提高精度,另外我想自己编写人脸检测训练模型。

网络摄像头获取的图像不够清晰,我准备换个摄像头。

唉,坑还是越挖越深啊~


  • 1
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
[本课程属于AI完整学习路线套餐,该套餐已“硬核”上线,点击立即学习!] 【为什么要学习深度学习和计算机视觉?】 AI人工智能现在已经成为人类发展中最火热的领域。而计算机视觉(CV)是AI中最热门,也是落地最多的一个应用方向(人脸识别,自动驾驶,智能安防,车牌识别,证件识别)。所以基于人工智能的计算视觉行业必然会诞生大量的工作和创业的机会。如何能快速的进入CV领域,同时兼备理论基础和实战能力,就成了大多数学习者关心的事情,而这门课就是因为这个初衷而设计的。 【讲师介绍】 CHARLIE 老师 1、人工智能算法科学家2、深圳市海外高层次人才认定(孔雀人才)3、美国圣地亚哥国家超算中心博士后4、加利福尼亚大学圣地亚哥全奖博士5、参与美国自然科学基金(NSF)及加州能源局 (CEC)资助的392MWIVANPAH等智慧电网项目6、21篇国际期刊文章(sci收录17篇),总引用接近10007、第一作者发明专利11份【推荐你学习这门课的理由:知识体系完整+丰富学习资料】 1、本课程总计9大章节,是一门系统入门计算机视觉的课程,未来将持续更新。2、课程从计算机视觉理论知识出发,理论结合实战,手把手的实战代码实现(霍夫变换与模板匹配,AlexNet OCR应用,VGG迁移学习,多标签分类算法工程) 3、带你了解最前沿技术,各类型算法的优点和缺点,掌握数据增强,Batchnormalization, Dropout,迁移学习等优化技巧,搭建实用的深度学习应用模型 4、学习完后,你将具有深度学习与计算视觉的项目能力,比如大学生学完可以具备独立完成机器视觉类毕业设计的能力,在求职过程中可以体系化的讲解机器视觉核心知识点,初步达到人工智能领域机器视觉工程师的水平 【学完后我将达到什么水平?】 1、零基础入门计算视觉,学习掌握并应用从经典图像处理到深度学习分类任务的要点知识 2、掌握数据增强,迁移学习等优化技巧,搭建实用的深度学习应用模型 3、学习完课程,可以独立应用多个经典算法和深度学习算法 4、以大学毕业设计,面试找工作为目标,手把手带大家编程,即使没有太多计算视觉的背景知识也可以循序渐进完成课程,获得实战项目的经验 【面向人群】 1、对AI感兴趣,想要系统学习计算机视觉的学员 2、需要毕业设计的大学生 3、做图像分析或相关数据分析的研究生 4、准备面试计算视觉和深度学习岗位的应聘者 5、希望在项目中引入计算视觉/深度学习技术的开发人员 【课程知识体系图】 【实战项目】

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值