NMS by Representative Region: Towards Crowded Pedestrian Detection by Proposal Pairing论文笔记

NMS by Representative Region: Towards Crowded Pedestrian Detection by
Proposal Pairing论文笔记

看论文的笔记,欢迎一起讨论,毕竟我是条咸鱼,求大佬指点*

一般学习的过程就是发现问题,解决问题,验证自己是对的。

1.发现问题:

pedestrian detection in crowded scenes is still challenging
然后作者发现目前的NMS方法不太work的样子,然后就提出了a novel Representative Region NMS (R^2NMS)的方法

目前NMS的缺点有:
A relative low threshold of intersection over union (IoU) leads to missing highly over lapped pedestrians, while a higher one brings in plenty of false positives.
这句话说IOU太低的话过度重叠部分会检测不到,过高会带来假正例的比较多.
对NMS和Adaptive NMS的分析。
*对NMS的分析
在这里插入图片描述
红色的框是full body predictions
绿色框是visible body predictions
原始的NMS方法会让红色虚点框消失, 而作者的方法保留了这点.

*对Adaptive NMS的分析
在这里插入图片描述
绿色框是真实的
红色框是预测的
预测过高,将会删除过多的预测框
However, density estima tion itself remains a diffificult task.
Besides, the matching from the density to the optimal IoU threshold is still handcrafted in AdaptiveNMS, and thus the exact matching is diffificult to acquire.

解决问题:

这里的解决问题指作者提出了怎样的模型
在这里插入图片描述
作者的基本框架如图, CNN Feature Extractor 在 CrowdHuman dataset中作者利用 Feature Pyramid Network (FPN) with ResNet-50 作为baseline
对于 CityPersons dataset, 采取了Faster R-CNN framework.
在这里插入图片描述
对于这一部分的设计,作者给出了具体算法
在这里插入图片描述
这个算法就是看visual part,当这一部分超过IOU留下visual part 和Full part
同时满足
在这里插入图片描述
其中A是 an anchor A is viewed as positive matched to the
ground-truth pair Q = (F, V)
α1 = 0.7 and β1 = 0.7.
在这里插入图片描述
在这里插入图片描述
这一部分是将特征级联,但是中间加入01色素图与Full part 做元素相乘
for a pair of annotation Q = (F, V), a pair of proposal X = (Pf,Pv) is positive
在这里插入图片描述
α2, β2 is 0.5 and 0.5.

验证问题:

具体的实验步骤,就是比之前的都改进了一点点
对于整篇论文,我感觉就是安照这个模型做 ,然后就没什么想法,
没什么改进, 完全不知道如何改进
如果对问题重定义,将Crowded Pedestrian Detection改为
Crowded Pedestrian search 是不是也有研究意义

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值