python + opencv提取图片中的人脸

机器学习需要大量的数据,从多渠道获得原始数据后,需要将图片中的人脸提取出来做训练集。

代码如下

#-*-coding:utf8-*-
import os
import cv2
import time
import shutil
 
def getAllPath(dirpath, *suffix):
    PathArray = []
    for r, ds, fs in os.walk(dirpath):
        for fn in fs:
            if os.path.splitext(fn)[1] in suffix:
                fname = os.path.join(r, fn)
                PathArray.append(fname)
    return PathArray

def readPicSaveFace_1(sourcePath,targetPath,invalidPath,*suffix):
    try:
        ImagePaths=getAllPath(sourcePath, *suffix)
 
        #对list中图片逐一进行检查,找出其中的人脸然后写到目标文件夹下
        count = 1
        # haarcascade_frontalface_alt.xml为库训练好的分类器文件,下载opencv,安装目录中可找到
        face_cascade = cv2.CascadeClassifier('E:\opencv-3.4.2\data\haarcascades\haarcascade_frontalface_alt.xml')
        for imagePath in ImagePaths:
            try:
                img = cv2.imread(imagePath)

                if type(img) != str:
                    faces = face_cascade.detectMultiScale(img, 1.1, 5)
                    if len(faces):
                        for (x, y, w, h) in faces:
                        # 设置人脸宽度大于16像素,去除较小的人脸
                            if w>=16 and h>=16:
                            # 以时间戳和读取的排序作为文件名称
                                listStr = [str(int(time.time())), str(count)]
                                fileName = ''.join(listStr)
                            # 扩大图片,可根据坐标调整
                                X = int(x)
                                W = min(int(x + w),img.shape[1])
                                Y = int(y)
                                H = min(int(y + h),img.shape[0])
 
                                f = cv2.resize(img[Y:H, X:W], (W-X,H-Y))
                                cv2.imwrite(targetPath+os.sep+'%s.jpg' % fileName, f)
                                count += 1
                                print  (imagePath + "have face")
                    #else:
                     #   shutil.move(imagePath, invalidPath)
            except:
                continue
    except IOError:
        print ("Error")
    else:
        print ('Find '+str(count-1)+' faces to Destination '+targetPath)

if __name__ == '__main__':
    invalidPath = r'E:\unused'
    sourcePath = r'E:\test' 
    targetPath1 = r'E:\target\alt'
    readPicSaveFace_1(sourcePath,targetPath1,invalidPath,'.jpg','.JPG','png','PNG')
    

我尝试了opencv3.4.2中haarcascades目录下所有的分类器,最终选定了alt、alt2、default和profileface四个来使用。其中alt、alt2和profileface识别出的较少,但准确率较高,default识别出的数量较多,但准确率较低。

haarcascades下的分类器

参考:https://blog.csdn.net/haohuajie1988/article/details/79163318

  • 3
    点赞
  • 31
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值