Mask RCNN 学习笔记+网络+ROI Align+ResNet

https://blog.csdn.net/jningwei/article/details/80429768

Mask RCNN 学习笔记,网络之类https://www.cnblogs.com/wangyong/p/9305347.html

令人拍案称奇的Mask RCNN+ROI Align(ROI Align难懂)https://zhuanlan.zhihu.com/p/37998710

详解 ROI Align 的基本原理和实现细节http://blog.leanote.com/post/afanti.deng@gmail.com/b5f4f526490b

https://deepsense.ai/region-of-interest-pooling-explained/

ResNet结构https://blog.csdn.net/lanran2/article/details/79057994

MASK_RCNN代码详解(1)-Basebone部分https://zhuanlan.zhihu.com/p/40314107

https://blog.csdn.net/qq_17448289/article/details/52871461

https://blog.csdn.net/zj15939317693/article/details/80569160

ROI Align的具体原理和实现细节已在博文中说明得很清楚了。在这一改进思路的启发下,博主尝试将 ROI Align 移植到 PS-ROI Pooling 中,实现了一个 Position Sensitive ROI Align 的算法。主要改进就是两次量化的取消:ROI的边界坐标值和每个ROI中所有矩形单元的边界值保持浮点数形式,在每个矩形单元中计算出固定位置固定数量的采样点的像素值作平均池化。具体的前向传播和反向传播细节如下:

前向传播: 
a. 遍历池化后特征图上的每一个像素点,在池化前特征图上寻找对应通道上的对应区域; 
b. 将每一个候选区域平均划分成 n * n 个单元; 
c. 在每一个单元内,按照设置的采样点数目计算出采样点的坐标值; 
d. 使用双线性内插的方法计算出特征图上每一个采样点处所对应的值; 
e. 依照平均池化的方式计算出 a 步骤中当前点的值,并且记录下所有采样点的位置坐标。
反向传播: 
a. 遍历池化后特征图上的每一个像素点,在池化前特征图上寻找对应通道上的对应区域; 
b. 在a步骤的当前区域中遍历每一个点,分别和前向传播中记录下来的所有采样点坐标比较,如果横纵坐标都小于1,则回传平均后的梯度值。
初步的实验表明,PS-ROI Align 对模型的检测性能有提升,对小物体的感知能力有明显改善
--------------------- 
作者:女王の专属领地 
来源:CSDN 
原文:https://blog.csdn.net/Julialove102123/article/details/80567827 
版权声明:本文为博主原创文章,转载请附上博文链接!

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值