faster RCNN-keras代码介绍:https://zhuanlan.zhihu.com/p/28585873
参考:https://blog.csdn.net/JNingWei/article/details/78847696
补充1:
在faster rcnn中,
Note:
- 只有在train时,cls+reg才能得到强监督信息(来源于ground truth)。即ground truth会告诉cls+reg结构,哪些才是真的前景,从而引导cls+reg结构学得正确区分前后景的能力;在reference阶段,就要靠cls+reg自力更生了。
- 在train阶段,会输出约2000个proposal,但只会抽取其中256个proposal来训练RPN的cls+reg结构;到了reference阶段,则直接输出最高score的300个proposal。此时由于没有了监督信息,所有RPN并不知道这些proposal是否为前景,整个过程只是惯性地推送一波无tag的proposal给后面的Fast R-CNN。
- RPN的运用使得region proposal的额外开销就只有一个两层网络。
300个proposal由什么分数决定的呢?这分数怎么产生?
(所以。。。。以及,在其他的目标检测算法中,怎么在测试阶段通过非极大值抑止选出框呢?由于要先找出分值最高的那个,用剩下的和它去进行比较,所以这个分数最高的怎么得到?)
解答:(参考:https://blog.csdn.net/ying86615791/article/details/72788414)
svm也有一个可能性的分数??
补充2:
11*11的特征图区域,在原图中就表示11*11个大黑框,每个大黑框里面又有9个小颜色框,这样就会产生11*11*9个不同位置,不同尺度,不同形状的物体框,基本足够框出所有物体了。
补充3:
Fast RCNN:https://zhuanlan.zhihu.com/p/24780395
https://blog.csdn.net/wonder233/article/details/53671018
Faster RCNN:https://zhuanlan.zhihu.com/p/24916624