基于Python的人脸检测与分类

segegefe

于 2022-05-20 08:20:00 发布

阅读量797

点赞数

分类专栏：面试学习路线阿里巴巴文章标签： python 分类开发语言嵌入式硬件面试

本文链接：https://blog.csdn.net/segegefe/article/details/124876044

版权

本文介绍了基于Python的人脸检测与分类算法，通过改进的RESNET101_V2网络实现小目标敏感，采用FDDB数据集进行训练。算法分为人脸检测和分类两部分，检测流程包括ROI处理、特征提取和Bounding Box回归，训练策略借鉴YOLO，测试结果显示网络能够有效识别人脸。

摘要由CSDN通过智能技术生成

人脸识别

算法简介

我们的算法可以分成两个部分，识别人脸位置和确定人脸分类。这两个部分可以看成：
1.检测出人脸之间相似性。
2.检测出人脸之间不同性。
由于这两项工作截然相反，所以我们使用了两个网络来分别完成这两项工作。

人脸检测

简述

我们的人脸检测网络采用了和Faster RCNN类似的策略，但我们在ROI Polling上进行了创新，兼顾了小目标检测和大目标检测，为此，我们还使用了改进后的RESNET101_V2的网络，使我们的网络对于小目标更加敏感。在增加了少量的运算单元后，我们的网络可以识别24*24像素下的人脸(甚至于更低!)。我们调整了网络结构，并没有采用传统的卷积网络(提取特征)+全连接层(分类)的结构，而是采用了全卷积结构，这让我们的识别网络的速度远远高于传统的神经网络识别方法，识别精度也高于传统的算子和特征值人脸识别算法。

数据集介绍

采用的数据集为FDDB数据集，该数据集图像+注释有600M左右。
图像有各种大小和形状，主要集中在(300600)*(300600)的像素上。
注:我们的训练网络不在乎训练图像的大小形状(只要长宽大于192就好)。
其注释内容为图像中的人脸椭圆框:

[ra, rb, Θ, cx, cy, s]
ra，rb：半长轴、半短轴
cx, cy：椭圆中心点坐标
Θ：长轴与水平轴夹角（头往左偏Θ为正，头往右偏Θ为负）
s：置信度得分

通过坐标变换后我们可以得到矩形框:

w = 2*max([abs(ra*math.sin(theta)),abs(rb*math.cos(theta))])
h = 2*max([abs(ra*math.cos(theta)),abs(rb*math.sin(theta))])
rect = [cx-w/2,cy-h/2,w,h]
即:
rect = [x,y,w,h](x,y为左上角坐标)

我们以图为单位，从图中抽取128个anchors，这128个anchors包括该图中的全部正例和随机的负例。最后使用我们进行坐标变换的矩形框进行Bounding Box回归。

算法介绍

流程图

img = tf.constant(img,shape = (1,h,w,mod),dtype = tf.float32) # 图像原始数据

# 使用无pool1&pool5的RESNET 101
net, endpoints = my_resnet(img,global_pool = False,num_classes=None,is_training=True,reuse = tf.compat.v1.AUTO_REUSE) # net's w&h = original_img's w&h / 8

我们进行模型搭建和使用的平台为windows10-python3.6.2-tensorflow-gpu。
首先，我们的图像(img_batch = [batch_size,h,w,mod],batch_size为图像的数量,h为图像高度,w为图像宽度,mod为图像通道数，这里我们处理的均为RGB三色彩图，所以我们的通道数均为3)通过我们改进版的RESNET101_V2网络，传统的RESNET101_V2的网络结构如下:www.biyezuopin.vip

而我们的网络去掉了pool1和pool5层，使网络放缩系数从32下降到了8。这使我们的网络对于小目标更加的敏感。通过了该网络后，我们得到了卷积后的信息图:img_batch_conv = [batch_size,h/8,w/8,2048]

weights = {
            'down':tf.compat.v1.get_variable(name = 'w_down',shape = [1,1,2048,1024]),# 降采样
            'feature':tf.compat.v1.get_variable(name = 'w_feature',shape = [1,1,1024,K*K*2])
            }
biases = {
            'down':tf.compat.v1.get_variable(name = 'b_down',shape = [1024,]), # 降采样
            'feature':tf.compat.v1.get_variable(name = 'b_

最低0.47元/天解锁文章

segegefe

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
基于Python的人脸检测与分类

人脸识别算法简介我们的算法可以分成两个部分，识别人脸位置和确定人脸分类。这两个部分可以看成：1.检测出人脸之间相似性。2.检测出人脸之间不同性。由于这两项工作截然相反，所以我们使用了两个网络来分别完成这两项工作。人脸检测简述我们的人脸检测网络采用了和Faster RCNN类似的策略，但我们在ROI Polling上进行了创新，兼顾了小目标检测和大目标检测，为此，我们还使用了改进后的RESNET101_V2的网络，使我们的网络对于小目标更加敏感。在增加了少量的运算单元后，我们的网络可以识别24
复制链接

扫一扫

专栏目录