人脸识别(基于Caffe, 来自tyd)

人脸识别(基于Caffe, 来自tyd)

人脸识别(基于Caffe, 来自tyd)

数据获取

  • 在相关的bentchmark找
  • 在thinkface论坛上找数据集
  • 截取人脸
    • 基于IoU
    • 负样本可以找一些物体的图片

人脸识别(判断是否为人脸)

LMDB(数据库, 为Caffe支持的分类数据源)

  • mkdir face_detect
  • cd face_detect
  • mkdir train val
  • mkdir train/{0,1}
  • mkdir val/{0,1}
  • 将人脸数据放到train/1val/1
  • 将非人脸数据放到val/0val/0
  • vim train.txt

0/xxx.jpg 0
1/xxx.jpg 1
  • vim val.txt

1/xxx.jpg 1
0/xxx.jpg 0
  • 拷贝Caffe自带的脚本根据上面的train.txt和val.txt制作LMDB数据源, 名为face_detect_lmdb.sh
# 修改部分
EXAMPLE=/home/jh/face_detect
DATA=/home/jh/face_detect
TOOLS=caffe安装目录/build/tools

TRAIN_DATA_ROOT=/home/jh/face_detect/train/
VAL_DATA_ROOT=/home/jh/face_detect/val/

# 对输入的数据进行大小的调整, 大小的调整是要根据我们要使用的网络模型, 比如AlexNet或者VGG(速度慢)为227x227
RESIZE=true
if $RESIZE; then
    RESIZE_HEIGHT=227
    RESIZE_WIDTH=227
else
    RESIZE_HEIGHT=0
    RESIZE_WIDTH=0
fi

# 接着修改GLOG_logtostderr那里的$DATA/train.txt, 这个为那个train.txt, $EXAMPLE/face_train_lmdb, 这个为生成的lmdb数据源的位置
# 下面也一样, 修改为val.txt, $EXAMPLE/face_val_lmdb, 这个为val的lmdb数据源生成的位置
  • 指定face_detect_lmdb.sh脚本文件, 如果那些face_val_lmdb已经存在则直接报错, 在执行过程中, 可能会出现Could not open ..., 这个没有关系, 执行的细节为, 先配置train, 在配置val
  • 因为数据源很大, 大约4W, 我们生成的lmdb文件为好几个GB, 再提一下, model大概为好几百MB

模型调优

  • 选择更深的网络, 改用VGG-16
  • 调整学习率
  • 图像增强

训练AlexNet网络(忘了, 去网上找AlexNet的结构图)

  • 对AlexNet进行简单的修改, 对最后的全连接层从1000改为2
  • 创建train.prototxt文件, 在里面写神经网络结构
  • 创建solver.prototxt文件
    • 指定test_iter, 测试多少个batch
    • test_interval: 1000, 迭代1000次进行测试
    • base_lr: 0.001: 基础学习率
    • max_iter: 10000: 最大迭代次数
    • gamma: 0.1
    • stepsize: 20000
    • display: 1000: 每1000次迭代显示一次
    • momentum: 0.9
    • weight_decay: 0.0005
    • snapshot: 10000: 每个10000次保存一次model
    • snapshot_prefix: "/path/to/model": 模型保存的目录
    • solver_mode: CPU: 使用CPU还是GPU

执行模型

  • 创建一个train.sh脚本

/path/to/caffe train --solver=/path/to/solver.prototxt
  • sh train.sh执行
  • 结束会生成一个模型文件(就一个, 就可以直接拿来用了)

网络训练速度限制

  • 网络大小
  • 输入数据的大小, 图片大小

人脸检测

  • 多尺度Scale变换
    • model从FC转为全卷积
    • 进行多个Scale变换->会导致有多个bbox, 后续需要NMS
    • 前向传播, 得到featureMap, 概率值矩阵
    • 反变换, 映射到原始图像
  • 滑动窗口
    • 多尺度的Scale变换, 对小人脸(如50x50)进行放大转为227x277, 对大脸进行缩小; 对原始图像进行10个缩放, 变成一个图像金字塔
  • 缺点
    • 网络AlexNet有一点大
    • 对原始图像进行了Scale变换, 导致输入数据变大
  • 如何解决
    • 看论文
posted @ 2019-04-06 10:46 Andrew_Chan 阅读( ...) 评论( ...) 编辑 收藏
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值