mask rcnn和roi-align

faster-rcnn的github源码中是round四舍五入

但kaiming he的ppt是直接取整

 

 

 

 

1.讲roi-align和roi-pooling区别并且详细阐述roi-align过程的博客:http://blog.leanote.com/post/afanti/b5f4f526490b,此博主还有另外一篇在rfcn中

使用roi-align的博客:http://blog.leanote.com/post/afanti/Position-Sensitive

2.具体讲解roi-align的计算方式,并且有整个网络的结构图,几个链接也有一些slide,这个博主的文章值得关注:http://blog.csdn.net/u013010889/article/details/78588227

3.Mask RCNN中的RoiAlign源码(caffe2)解读: http://blog.csdn.net/yiyouxian/article/details/79221830

 

roi-align总结:对于每个roi,映射之后坐标保持浮点数,在此基础上再平均切分成k*k个bin,这个时候也保持浮点数。再把每个bin平均分成4个小的空间,然后计算每个小空间的中心点的像素点对应的概率值。这个像素点大概率是一个浮点数,实际上图像的浮点是没有像素值的,但这里假设这个浮点数的位置存储一个概率值,这个值由相邻最近的整数像素点存储的概率值经过双线性插值得到,其实也就是根据这个中心点所在的像素值找到所在的小空间对应的4个整数像素存储的值,然后乘以多个参数进行插值。这些参数其实就是那4个整数像素点和中心点的位置距离关系构成参数。最后再在每个bin中对4个中心点进行max或者mean的pooling。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值