昨天看到目标检测原理讨论群703346870进行了激烈的讨论。个人理解如下。
1. 概念理解:
ROI, region of interest,感兴趣的(图像后者feature map)区域,数学表示上是一个矩形(x,y,w,h),表示可能出现物体的部位。
FPN, feature pyramid network, 特征金字塔,是一个通用的backbone,类似于resnet
RPN, roi proposal network,roi 建议网络,是产生roi的网络
roi pooling层,对feature map上的roi 进行pooliing
2. 过程的理解
理解1 :图像中roi区域通过cnn网络之后提取的feature中roi,其位置和大小都是成比例对应的。
理解2 :卷积出的feature map可以赋予不同意义
fast rcnn中 RPN网络其实就是几个卷积网络产生可能的roi,是rcnn的升级版,具体思路是让卷积产生的feature map表示物体可能的位置。
YOLO更近一步,让卷积产生的feature map 直接表示物体的位置。
参考资料:
知乎https://zhuanlan.zhihu.com/p/73654026
博客https://blog.csdn.net/AUTO1993/article/details/78514071
目标检测原理群:703346870(原始论文已上传到该群)
图像分割原理群:425030356
强化学习原理群:112107531
OCR原理群 :643021765
目标检测工程群:916212380
图像分割工程群:1030854880
强化学习工程群:1005654907
OCR工程群 :1007648445