AI面经(提问论文时如何出彩?)——Cascade RCNN为例

AI面经(提问论文时如何出彩?)——Cascade RCNN为例

AI面的时候,问你看过的论文,是在正常不过的事情了,那如何出彩呢?拿Cascade RCNN论文为例(其实这个也是平时读论文应该做到的)

应该再加一个,这样的论文,精度体现在哪里?比如说cascade 在map方面,主要提升IOU阈值比较高的。ap0.9这种的,还有什么时候会出现不work的情况!

目录

0.本质

1. 提出的背景(也是重点,每个论文提出的原因)

2. 作者的实验(证明你的论文视角)

1.如何改进

2.改进的必要性的证明

3.训练和测试

3.我的改进(证明你的论文宽度)

4.搞源码过程收获(证明你确实有看)


0.本质

本质是不同resample,提高样本质量的过程。

1. 提出的背景

普通的二阶段,我们知道在ROIHead也就是Prososal Target Layer代码生成roi的时候,是在上层nms之后得到的2000个里面,按照IOU 0.5的阈值,生成正(32)负样本(96),而对于回归来说只是回归前景对应的全连接层。【单一阈值的回归样本质量】

实验发现不同的IOU阈值训练的模型,对于输入的时候不同IOU的ROI,有着不同的回归定位能力。

 

2. 作者的实验

1.如何改进

分析实验,0.5的阈值,对于IOU等于0.5的那些,回归能力更好,0.6的阈值,对于IOU等于0.6那些,回归能力更好。

最后分别设置0.5 0.6 0.7的阈值,然后级联。(下面的H就是ROIHead,所以可以说是一个RPN后面,级联了三个ROIHead)

2.改进的必要性的证明

实验表明,这样的级联结构,在第三阶段的时候,高IOU的样本占比会明显增强。

3.训练和测试

对于训练和测试阶段,均在用级联的这种设置。

3.我的改进

针对高分类的框并不一定定位准!

1.在一些比赛的中,有人不是直接利用NMS之后的结果,而是将NMS之后的结果,和这个框附近的比较的高IOU的框,进行平均,因为高分类的框并不一定定位准!

2. IOUNet 改进,在cascade rcnn中就已经说明了,级联的越多并不一定会更好,回归的过程有可能把好的样本给剔除掉了,在IOUNet中得到了很好的可视化效果。其实是明明是回归,却用的分类的指标进行NMS。在该文中提出的IOUScore的方式。将分类的最高分数给IOU最好的框,替换。

3. 加入像resnet论文中提到的contextual roi pooling'

4. PANet中,修改FPN的ROIpooling一样,并不是对应到哪一层就用哪一层的特征,而是都用!

4.搞源码过程收获

Cascade RCNN中的FPN进行了改进,可以很好的利用了邻接的context信息。

和FPN的图中定义类似,我们把最后要输入RPN的层定义为P层,之前的为基本层经过1*1的全卷积后改变通道数后的层定义为C层。那么比如说P3层的形成,它就是由P3=C5上采样上采样+C4上采样+C3+C2下采样然后3*3卷积去混叠

这里的下采样选用了反卷积的操作。

传统的FPN不同,传统的是P3并没有C2直接传给的信息,而间接传上来的信息,数据分布已经变了,丢失了很多信息。

  • 1
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值