行人检测“Joint Deep Learning for Pedestrian Detection”

动机:行人检测中的特征提取,形变处理,遮挡处理和分类联合学习。深度网络可以将各部分放到不同的网络层并使用BP进行优化。

这里写图片描述

相关工作:
用于行人检测的特征:Haar,HOG,SIFT,一阶颜色特征如颜色直方图,二阶颜色特征如CSS,co-occurence特征,纹理特征LBP,其他形式的特征包括协方差,深度图,分割结果,3D几何,深度学习局部最大或平均池化特征。这些特征没有考虑行人的形变特征。
处理形变:DPM
处理遮挡:主要用part进行处理

方法描述
文章深度网络框架如下图所示,每层功能描述如下:
1.filtered data map的获取:第一个卷积层对三通道的输入图像使用9*9*3的滤波器,输出64个特征图,激活函数用tanh(x)
2.特征图获取:平均池化
3. part detection map:第二个卷积层,20个part filters进行卷积
4. part score:形变处理层
5. 估计标签:可视化推理,某bbox是否包含行人
这里写图片描述

准备输入数据
输入的图像数据包含三个通道:YUV尺寸为84*28尺寸的Y通道,YUV三通道42*14串联空白加零,4个边缘图串成42*24大小图像。

生成part检测图
第二个卷积层的part滤波器具有不同的大小,设计了三层不同尺寸的滤波器,如下图 所示,上层的滤波器包含下层滤波器的部分,上层的parts是有可能存在的遮挡情况。
这里写图片描述

deformation 层
形变层输入P个part检测图输出得分 s=s1,...,sp ,2D summed map是part检测图和形变图的加和,即:
Bp=Mp+cn,pDn,p (1)
Dn,p 表示part p的第n个形变图, sp Bp 全局最大池化得到:
sp=maxx,ybx,yp
part位置:
(x,y)p=argmaxx,ybx,yp
cn,p,Dn,p 都是可学到的参数。

形变层可表示为DPM中的二次形变约束,即:
这里写图片描述
可用公式(1)表示为如下形式:
这里写图片描述
过程如下图所示:
这里写图片描述

Visibility推理及分类
part j在l层的得分和visibility表示为 slj,hlj ,l层part的visibility为 hl=[hl1,...,hlPl]T ,BP模型如下:
这里写图片描述

论文的方法增加part 2层和3层的隐含节点,这样可以将1层和2层的信息直接传播到分类器,如下图,用白色节点表示:
这里写图片描述

在论文中,特征,形变模型,visibility关系联合学习,为了学习两个卷积层和形变层的参数,通过得分s进行反向传播:
这里写图片描述

实验结果
在Caltech上的实验结果对比如下:
这里写图片描述

  • 1
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值