【目标检测算法】Faster RCNN学习笔记（实验过程中的补充）

最新推荐文章于 2024-05-04 15:32:23 发布

sdbhewfoqi

最新推荐文章于 2024-05-04 15:32:23 发布

阅读量1k

点赞数

分类专栏：计算机视觉

本文链接：https://blog.csdn.net/weixin_31866177/article/details/82912936

版权

41 篇文章 9 订阅

订阅专栏

补充1：

在faster rcnn中，

Note：

只有在train时，cls+reg才能得到强监督信息(来源于ground truth)。即ground truth会告诉cls+reg结构，哪些才是真的前景，从而引导cls+reg结构学得正确区分前后景的能力；在reference阶段，就要靠cls+reg自力更生了。
在train阶段，会输出约2000个proposal，但只会抽取其中256个proposal来训练RPN的cls+reg结构；到了reference阶段，则直接输出最高score的300个proposal。此时由于没有了监督信息，所有RPN并不知道这些proposal是否为前景，整个过程只是惯性地推送一波无tag的proposal给后面的Fast R-CNN。
RPN的运用使得region proposal的额外开销就只有一个两层网络。

300个proposal由什么分数决定的呢？这分数怎么产生？

（所以。。。。以及，在其他的目标检测算法中，怎么在测试阶段通过非极大值抑止选出框呢？由于要先找出分值最高的那个，用剩下的和它去进行比较，所以这个分数最高的怎么得到？）

svm也有一个可能性的分数？？

11*11的特征图区域，在原图中就表示11*11个大黑框，每个大黑框里面又有9个小颜色框，这样就会产生11*11*9个不同位置，不同尺度，不同形状的物体框，基本足够框出所有物体了。

关注

专栏目录