导言:我一直受惠于很多网络上图文并茂的优秀英文技术文,这些文章不仅便于理解也便于回顾,因为很多时候再次见到图就能回想起当时学会的复杂概念,所谓千言万语不及一张图。MyEncyclopedia公众号会每次一个概念逐渐建立起主流 AI 领域(CV,NLP,RL,GNN)最直观最形象的概念和技术,并整理成知识网。
文章首发于公众号 https://mp.weixin.qq.com/s/u39urFx_q0Z9Yb4BNv-ZUQ
我们将讨论Fast R-CNN论文(上图中的浅蓝色矩形)中描述的原始 RoI 池化。该过程有第二个和第三个版本,称为RoIAlign和RoIWarp。
RoI(感兴趣区域)是什么?
RoI(感兴趣区域)是来自原始图像的建议区域。我们不打算描述如何提取这些区域,因为有多种方法可以做到这一点。我们现在唯一应该知道的是有多个这样的区域,最后目标检测算法对所有区域进行分类。
Fast R-CNN 的工作原理是什么?
Fast R-CNN不同于基本的R-CNN网络。它只有一个卷积特征提取(在我们的示例中,我们将使用 VGG16)。
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-e760puuH-1675775746574)(https://mydoc.myencyclopedia.top/api/temp_imgbed/downlo