最近做了这个小项目,权当练手。在网上收集了不少戴口罩的人脸图片,往往是一张图片中有多个人脸,不符合使用要求,便编写了个脚本使用opencv自带的人脸检测器将其中的人脸检测并截取保存下来,一共收集了3000张戴口罩人脸图片,未戴口罩的3000张人脸图片来自celebA数据集,同样使用了上述脚本进行处理。
图片链接:https://pan.baidu.com/s/1-tW-vWOUHZSdIl6E6uJmXA
提取码:misg
后来发现准确率太低,只有74.1%。猜想可能是因为戴口罩图片质量参差不齐,有的太小,有的太暗,有的只有半张脸等等。后来再次使用脚本处理,3000张图片中筛选留下673张,这673张都是十分规范的图片,毕竟不规范的也检测不出来。再次训练模型,准确率达到了91.2%。
代码如下:
CropFaceImage.py:从指定文件夹中遍历图片文件,从中检测出人脸并截取保存到指定文件夹。我们搜集到的数据集可能一张图片包含多个人脸,不适用于我们的代码,因此这一步预处理很重要。
DeleteSmallPic.py:从指定文件夹中遍历图片文件,删除尺寸过小的图片。
FileMove.py:将指定目录下的图片批量移动到另一个目录下,在搜集图片制作数据集时可能会