ADCrowdNet: An Attention-injective Deformable Convolutional Network for Crowd Understanding
(注入注意力的可形变卷积,可形变的卷积加入了方向参数,指导卷积核的在特征图上的延伸)
- 提出一个两阶段的串联网络AMG和DME,解决高密度人群中准确率下降的问题
- 关于AMG网络(注意力图部分)
AMG网络将特征图分为前景和背景图。通过对获得的特征图取全局平均池化相应的权重,再对其结果用softmax进行分类获概率。对特征图和概率进行叠加获得密度图通过对获得的特征图取全局平均池化相应的权重,再对其结果用softmax函数获得概率。对特征图和概率进行叠加获得注意力图。注意力图强调了人群的区域
- 注意力图和原图的结合
对原图和注意力图进行像素级点乘
- AMG的实现
前端使用了VGG-16的前十层提取基础特征
后端采用了基于多尺度空洞卷积(空洞率不同)的Inception结构(该思路来