自学机器学习笔记(十三)

人脸识别的卷积神经网络

在最后一层,如在常用的WEBFACE数据库,总共有10575人,也就是10575类,最后一层SOFTMAX的输出时10575维。

因此我们在训练时保留最后一层SOFTMAX,而在测试时却不要最后一层,将倒数第二层160个维度作为最后的人脸识别的特征。

在测试时,每张人脸通过卷积神经网络,获得160维向量,利用距离量度,算出基于这160维向量的人脸距离,最终通过阈值获得识别结果。

近年来在损失函数的改进

      

 

 还有COSINFACE和ARCFACE

 

 对于损失函数另一方面的改进 TRIPLET LOSS:三元组损失函数

 

 在实现人脸识别系统的时候,首先应该做的时人脸检测和人脸对齐(MTCNN)

目标检测与分割

 

目标定位与识别

除了要识别目标的类型,还要找出目标的位置,在网络的最后一层,增加4个维度的输出,

分别代表方框的左上坐标点(x,y),方框的长(w,h)

图像需要进行归一化,使得这四个坐标在不同图像中具有等价关系

然后用卷积神经网络直接获得识别结果

目标检测

图像中有多个目标,我们要检测出他们的位置,同时对每个目标都要进行识别

RCNN用来处理这种情况

核心思路:ROI的候选区域

主要想法:用SELECTIVE SEARCH去产生候选的方框,将这些候选方框输入到CNN中最后用SVM来判断检测结果是否正确。

SELECTIVE SEARCH的算法REGION PROPOSALS

用Efficient Graph-Basedlmage Segmentation算法,将图片进行过分割

过分割后的每个region非常小

每个region对应一个bounding box

R-CNN步骤

用SELECTIVE SEARCH产生一些候选区域

对于候选区域进行长和宽的归一化后输入到CNN中获得目标识别结果

使用SVM对这些候选区域来确定他们是存在目标还是不存在目标

R-CNN的缺点:计算消耗太大

FAST R-CNN 用ROI-POOLING加速CNN特征提取过程

用CNN对整幅图进行卷积

在中间某一层的特征图上再用ROI-POOLING来归一化每个候选区域的输出

仍然需要耗费较多时间产生候选区域

FASTER R-CNN

在卷积后的特征图上滑动窗口

用不同长宽比的矩形作为候选区域

用一个小网络来判断这些候选区域是不是存在目标

运用POI POOLING进行归一化

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值