SPP引入之后,解决了输入图片尺寸不一致和多次feed proposal带来的问题,但是训练过程仍然比较繁琐,需要提取proposal,训练cnn,还要训练SVM,分别输出box坐标和类别,且过程中要占用大量磁盘资源,为了解决这个问题,R-CNN原作者提出了Fast R-CNN,设计了ROIpooling,其实是SPP的简化版,不过也解决了尺寸问题,同时采用了SPP的proposal策略,同时将SVM换为softmax,从二分类转为多分类,引入类间竞争,也减少了不必要的训练;最重要的是将网络设计为同时输出两个任务的数值,通过Multi-task Loss来引导训练,极大减少了计算量,Fast R-CNN尽管速度和精度上都有了很大的提升,但仍然未能实现端到端(end-to-end)的目标检测,比如候选区域的获得不能同步进行,速度上还有提升空间。
Fast R-CNN论文略读
最新推荐文章于 2023-01-25 12:04:03 发布