手把手带二大爷用EasyDL实现戴口罩检测APP

1 篇文章 0 订阅
1 篇文章 0 订阅

1 前言

口罩作为常用的医疗用品,一直坚守在人们健康卫生的第一防线。食堂打饭,比手抖更可怕的是阿姨不戴口罩的亲切问候;工厂生产,为了避免粉尘危害呼吸道,戴口罩也是对员工规范操作的基本要求;尤其是近几年疫情影响,口罩更是成为生活必需品,逛商场、公园必须戴口罩,乘坐公共交通工具必须戴口罩,进去医院、食堂等公共场所更是必须戴口罩。

当戴口罩成为基本操作时,总有人不能很好的执行,为了监督落实,往往会增加工作人员,负责检查戴口罩情况,我退休2年的二大爷很荣幸收到某公园邀请返聘担任该职责。

刚开始一个月,二大爷干的很开心,看到有大爷大妈没戴口罩就拿着小旗子把别人拦下,从国家政策聊到国际形势,最后想起来劝别人戴口罩。后来大爷大妈看到二大爷拿着小旗走过来就赶紧戴上口罩,二大爷值班一天都没机会开口讲话,很郁闷,然后玩起了手机,但是又担心有人不戴口罩趁他不注意混进去了,回来让我们想想办法。

三大爷以他多年菜市场卖菜的经验,送了他一个大喇叭,让他拿着反复播放“入园请佩戴好口罩”的提示音。可是公园乃清净养心之地,这大喇叭整天喊总有一天要被投诉。结果没等别人投诉,二大爷自己都听的受不了,又跑来找到我,说你们都讲科技向善,倒是来帮帮我这个退休老人啊!

我想是时候该我出手了,解放双手、释放劳动力、提升工作效率。我打算训练一个模型,用来检测人脸是否戴口罩。判断人脸是否戴口罩属于图像分类问题,由于之前没做过CV,所以还要学习一下,并把背景知识和操作过程记录下来,便于二大爷亲自上手。

2 图像分类

图像分类是计算机视觉中最基础的一个任务,图像分类的目标就是将不同图片划分到不同类别,实现最小的分类误差。在这个过程中存在诸多挑战,但机遇与挑战并存。近年来随着深度学习技术的兴起,图像分类得到飞速发展,并延伸出一系列的研究方向,如:多类别图像分类,细粒度图像分类,多标签图像分类,无/半监督图像分类,零样本图像分类等。简单来说,就是从已知的类别标签集合中为给定的输入图片选定一个类别标签

图像分类常用数据集:猫狗识别、鸢尾花识别、手写字识别。

以猫狗识别举例,假设我们的类别集为{cat,dog,other},给出一张图:

dog
分类模型将给该图像分配标签,并给出每个标签的概率,如:{dog:96%,cat:3.5%,other:0.5%},根据概率,我们知道该图像中的动物是狗。

口罩检测也一样,我们有两个结果集:{unmask,mask},通过给定的人脸照片,判断unmask和mask的概率。

图像分类常见的技术难点有以下几点:

(1)视角变化:同一个物体,摄像机可以从多个角度来展现。
(2)大小变化:物体可视的大小通常是会变化的。
(3)形变:很多东西的形状并非一成不变,会有很大变化。
(4)遮挡:目标物体可能被挡住。有时候只有物体的一小部分是可见的。
(5)光照条件:在像素层面上,光照的影响非常大。
(6)背景干扰:物体可能混入背景之中,使之难以被辨认。
(7)类内差异:一类物体的个体之间的外形差异很大,比如椅子。这一类物体有许多不同的对象,每个都有自己的外形。

传统图像分类问题的处理主要涉及三部分关键步骤:

(1)数据预处理
(2)图像特征
(3)分类模型

常见图像分类算法有:KNN、SVM、BP神经网络、CNN

在这里插入图片描述

涉及到的知识挺多的,为了快速高质量解决问题,并且让二大爷零门槛入门,我选择了EasyDL零门槛AI开发平台。

3 EasyDL

EasyDL从2017年11月中旬起,在国内率先推出针对AI零算法基础或者追求高效率开发的企业用户的零门槛AI开发平台,提供从数据采集、标注、清洗到模型训练、部署的一站式AI开发能力。对于各行各业有定制AI需求的企业用户来说,无论您是否具备AI基础,EasyDL设计简约,极易理解,最快5分钟即可上手学会,15分钟完成模型训练。

您采集到的原始图片、文本、音频、视频、OCR、表格等数据,经过EasyDL加工、学习、部署后,可通过公有云API调用,或部署在本地服务器、小型设备、软硬一体方案的专项适配硬件上,通过离线SDK或私有API进一步集成,流程如下: 产品流程01.png

其中,**EasyDL 图像,**支持定制基于图像进行多样化分析的AI模型,实现图像内容理解分类、图中物体检测定位等,适用于图片内容检索、安防监控、工业质检等场景。其中图像分类正是我们遇到的问题。

且支持公有云API、本地服务API和SDK的部署方式,方便我们低成本解决问题。

EasyDL不需要关注算法本身,零门槛、低成本、高精度的特性能够在最短时间帮我们解决问题。

接下来喊二大爷直接上手!

4 轻松上手

4.1 创建模型

打开EasyDL首页:https://ai.baidu.com/easydl

在这里插入图片描述

点击立即使用

在这里插入图片描述

可以看到EasyDL目前支持的各种模型类型,我们要做目标人群是否戴口罩的检测,所以选择图像分类

在这里插入图片描述

然后创建口罩检测的模型
在这里插入图片描述

填写模型名称,选择个人身份,填写邮箱、联系方式和业务描述等基本信息,放心填写,不会收到营销电话,仅用于算力资源额度不足时提醒

在这里插入图片描述

4.2 创建数据集

模型创建好后,需要导入数据集并训练模型,我们先创建数据集

在这里插入图片描述

填写数据集名称,点击完成

在这里插入图片描述

数据集创建完成后,导入数据

在这里插入图片描述

选择有标注数据集,由于我们的数据集已经标注好了,分类放在不同的文件夹下,以压缩包的形式准备着,所以选择有标注的数据集,导入方式选择本地压缩包的形式导入。标注形式为文件夹命名分类。选好之后选择上传压缩包
在这里插入图片描述

阅读并同意,然后上传压缩包

在这里插入图片描述

上传压缩包后,点击确认并返回

在这里插入图片描述

可以看到数据集正被导入

在这里插入图片描述

导入完成后,可以看到一共有183张图片,标注状态为100%,不需要手动标注

在这里插入图片描述

4.3 模型训练

接下来开始训练模型

在这里插入图片描述

首先选择我们刚刚创建的数据集

在这里插入图片描述

添加刚刚创建的数据集

在这里插入图片描述

添加好后,点击确定

在这里插入图片描述

接下来设置训练配置

在这里插入图片描述

其中,公有云部署训练的模型以公有云API的方式提供,优点是方便自己开发应用,缺点是每个人公有云免费调用额度有限,额度用完了会收费。

我们看到有限时免费的浏览器/小程序部署选项可选,这种部署方式,模型会下载到本地,通过SDK调用本地模型进行识别,免费的,不占用百度算力资源,可以离线部署,看来可以通过这种方式白嫖了。

选择浏览器/小程序部署 ,训练环境选择免费的

在这里插入图片描述

点击开始训练,即可看到模型已经在训练中,填了手机号之后训练完成还会短信通知自己

在这里插入图片描述

由于我们数据量较少,训练很快,收到训练完成短信通知后,我们回来可以看到模型效果

在这里插入图片描述

点击申请发布,发布模型

在这里插入图片描述

模型发布需要一点点时间

在这里插入图片描述

等模型发布完成之后,可以看到模型信息

在这里插入图片描述

4.4 模型体验

点击下载SDK

在这里插入图片描述

得到一个基于Vite的demo,代码结构:

|--public
|  |--model
|     |--model.json
|     |--chunk_1.dat
|     |--chunk_2.dat
|     |--chunk_3.dat
|--src
|  |--components
|  |--App.vue
|  |--config.json
|  |--env.d.ts
|  |--label.json
|  |--main.ts
|  |--modelInfo.json
|  |--usePredict.ts
|--index.html
|--package.json
|--READ.md
|--tsconfig.json
|--tsconfig.node.json
|--vite.config.ts
|--yarn.lock

其中public/model下的model.json、chunk_1.dat…chunk_n.dat为模型文件,src下为业务代码,index.html为入口文件

安装依赖:npm install

在这里插入图片描述

启动项目:npm run dev

在这里插入图片描述

浏览器打开http://localhost:3000,可以看到主界面

在这里插入图片描述

上传图片看下效果

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

我们可以看到,口罩检测效果还是非常好的。

在这个过程中,我们没有写一行代码,却轻松得到一个口罩检测的工具,二大爷表示,so easy!

5 产品优化

将SDK封装成APP,检测戴口罩概率大于55%时认为已经配戴口罩,否则没有配戴口罩。APP启动时打开摄像头,二大爷对着门口排队的人,每0.5秒自动拍照并检测是否戴口罩,并将结果显示在屏幕右上角

在这里插入图片描述

检测到未戴口罩的人时,提示未戴口罩,同时播放语音,提醒对方配戴口罩

在这里插入图片描述
在这里插入图片描述

6 产品迭代

才过了2天,二大爷又找到我,说APP好用是好用,就是要一直拿着,还不能玩手机,感觉不比原来轻松多少,问我有没有更好的方案。

我拿出祖传的树莓派,说当然有了,有了它你可以下岗了。

二大爷一惊,说那不是还要买摄像头什么的,多麻烦啊,还是算了。

又过了几天,二大爷又兴冲冲的找到我,说保卫处领导说了,这个工具很好,借助科技力量解决工作生活中的问题,是应该得到支持的,希望他老人家继续研究出更好用的产品,不用下岗,可以换岗到健康码检查岗。

一个新的产品在我脑海中已经形成:公园门口第一道闸机检测口罩,检测到人脸正常佩戴口罩闸机才开门,未佩戴口罩则提醒游客佩戴口罩。

现在二大爷每天下班就跟我一起学习,我想起之前看到一个网友问,35岁开始学编码晚不晚?你不妨从EasyDL开始,我二大爷都60多了!

7 参考文献

[1] CS231n Convolutional Neural Networks for Visual Recognition:http://cs231n.github.io/convolutional-networks/
[2] How to Retrain Inception』s Final Layer for New Categories:https://www.tensorflow.org/tutorials/image_retraining
[3] Image Augmentation for Deep Learning With Keras:http://machinelearningmastery.com/image-augmentation-deep-learning-keras/
[4] 飞桨EasyDL:https://ai.baidu.com/easydl
[5] 图像分类算法:https://blog.csdn.net/seek97/article/details/119219087

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值