前言
当年参考的从rcnn到faster-rcnn系列的文章链接失效了,充分说明自己记录一份的重要性,虽然现在有更多从rcnn到maskrcnn的解析文章,但是很难再有那时候晚上睡觉,满脑子的共享卷积层上的小窗口随着心跳像贪吃蛇一样动态滑动的感觉了。(对,就是失眠了。。。。。。)
从RCNN到Faster-RCNN
- 目标需求:如何检测出不同物体?
- 任务分解:识别+分类
本来想多贴几张图,发现这个链接https://www.jianshu.com/p/1f975b05ca86写的很详细了,希望不要又失联了。历史欠债太多,等所有系列完成后有时间专门再来整理吧。整理资料原来也是这么花时间的。。。还是那么遥远的资料。正确的记录方式还是应该边做边记录,阶段性再总结。时间永远是稀缺的。
当我们谈论Faster-RCNN的时候,我们在谈论什么.
- 任务分解:识别+分类(小分类与大分类)
- 识别+小分类(是否有物体):RPN
- 大分类(物体是什么类型):RPN → \to →Fast-RCNN
虽然Faster R-CNN的重点是提出了RPN从而提升了速度,然而当一个小白刚刚试过imagenet的CNN分类,就直接上手Faster R-CNN的时候,很自然的就会发问,这个识别网络到底在学习什么东西?它为什么能够自适应大小的框出我要的东西?当进一步去探讨这个问题的时候,整个脉络里Fast R-CNN甚至更久之前的的研究回答了这个问题,而这个答案,比RPN更能击中心里的那个点。所以与其说在讨论Faster R-CNN,不如说是整个Faster R-CNN的脉络。
- [1] Fast R-CNN - [2] Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks. - [3] https://www.jianshu.com/p/1f975b05ca86