[论文笔记] PyramidBox阅读笔记

PyramidBox: A Context-assisted Single Shot Face Detector(ECCV 2018)

论文链接:论文链接
代码链接:代码链接,原版代码在paddle,但是现在不知道为什么找不到了,这里提供的是其他版本

  • 我是专门来看这篇文章中的context的做法的
  • context能不能用于进行坐标回归里面,而不仅仅用在分类当中
  • context相关论文:CMS-RCNN、SSH、FAN

动机

  • 使用context解决小目标,模糊目标,部分遮挡的目标检测

解决方案

  • 整体方案(基于context)
    • Low-level Feature Pyramid Network(LFPN):将足够的high level特征和 low level 的特征结合在一起
    • Context-sensitive prediction module (CPM):引入context信息
    • PyramidAnchors:设计一种“context anchor”,通过半监督方法监督high level上下文特征学习
    • Data-anchor-sampling:增加不同尺度的训练样本数量

网络结构

在这里插入图片描述

能不能不要下采样,因为下采样之后,high-level的特征对应原图感受野太大了,特征融合之后的效果感觉更多的是一个整体的特征,并不能精细化

Low-level Feature Pyramid Network(LFPN)

在这里插入图片描述

  • 和FPN不一样的地方在于,LFPN将低层的一些特征进行了融合,而高层特征因为感受野太大了,不适合用于人脸检测

Context-sensitive Predict Module(CPM)

  • CPM借鉴了SSH和DSSD。SSH通过在不同分支上不同的stride+conv堆叠来扩展感受野大小,学习更多的contextual information;DSSD使用residual block,得到deeper的预测分支。将SSH中的context module中的conv层换成DSSD的残差预测模块,这样CPM同时包含了DSSD+SSH的上下文信息的优势
  • CPM的输出 w l × h l × c l w_l×h_l×c_l wl×hl×cl,其中 w l = h l = 640 2 2 + l w_l=h_l=\frac{640}{2^{2+l}} wl=hl=22+l640(和LFPN每个输出特征图的大小一致),通道 c l = 20 c_l=20 cl=20,每个通道的特征分别用来进行分
  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值