mask rcnn算法分析_注意力模型RPN（faster-rcnn）与APN(RA-CNN）对比精析

最新推荐文章于 2024-04-09 16:42:34 发布

weixin_39628256

最新推荐文章于 2024-04-09 16:42:34 发布

阅读量1.3k

点赞数

文章标签： mask rcnn算法分析 pytorch mask rcnn tictoc正方形网络模型注意力机制 cnn keras

文章有些长，建议收藏后慢慢看。

细粒度图像分类仍然是一个可以出文章的课题。做这个方向的人，我觉得可以好好琢磨注意力机制。注意力机制的本质跟人眼的工作原理是相近的，因而可以让机器更智能。

学习就是一个建立知识树的过程。网上有很多文章都只是树身上树干上的一个小枝干，所以不能给你建立一个完整的知识体系树。

今天我这篇文章也只是一个小枝干。

我力争让大家能够窥一斑而知全豹。

Faster-rcnn和RA-CNN两篇文章都是在注意力机制上做文章，前一篇是监督式的，后一篇是半监督的。我觉得半监督学习是一个很有意思的事情。

后一篇篇文章的地址在这里：

论文：Look Closer to See Better: Recurrent Attention Convolutional Neural Network for Fine-grained Image Recognition
论文链接：http://openaccess.thecvf.com/content_cvpr_2017/papers/Fu_Look_Closer_to_CVPR_2017_paper.pdf

(1) Faster-rcnn中的RPN。

温故而知新。我还是希望深入浅出的给大家拎一下faster-rcnn的知识脉络。

1、输入与输出。输入是规整化1000*600的图片+标注的框，这个规格是参数，你自己可以指定。指定完后，输入的框的坐标自然做放大或缩小。同时把这个扩大缩小的比例记录下来。在输入的DATA层参数im_info里。算法的输出是目标框坐标和框中的物体名称。

2、RPN的功能。RPN就是根据注意力机制生成候选框的。要讲清楚这个里面的机制，得讲明白两个核心概念：anchor和ROIpooling。

Anchorÿ

最低0.47元/天解锁文章

weixin_39628256

关注

0
点赞
踩
11

收藏

觉得还不错? 一键收藏
0
评论
mask rcnn算法分析_注意力模型RPN（faster-rcnn）与APN(RA-CNN）对比精析

文章有些长，建议收藏后慢慢看。细粒度图像分类仍然是一个可以出文章的课题。做这个方向的人，我觉得可以好好琢磨注意力机制。注意力机制的本质跟人眼的工作原理是相近的，因而可以让机器更智能。学习就是一个建立知识树的过程。网上有很多文章都只是树身上树干上的一个小枝干，所以不能给你建立一个完整的知识体系树。今天我这篇文章也只是一个小枝干。我力争让大家能够窥一斑而知全豹。Faster-rcnn和RA-CNN两篇...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。