M2Det的学习过程

绿小油

于 2019-05-30 09:16:53 发布

阅读量1.7k

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/html5baby/article/details/90671703

版权

不全，待补充

主要框架：

分析解释这个框图：

M2Det主要是有三部分组成，主干网络、MLFPN(muli-level 的FPN、以及预测层。

其中主干网络是用两个尺度进行特征提取。将这两个尺度的特征合并输入到MLFPN中

MLFPN则由三部分组成，FFM、TUM、SFAM。

FFM

FFMv1是对主干网中提取出来的内容进行合并，得到base feature。

FFMv2是用来整合TUM中最后一层的特征和basefeature整合在一块送入下一个TUM中。

在base feature的基础上做TUM，这里解释啥是TUM？

TUM

编码器是一系列的步长为2，卷积核为3*3的Conv，解码器将这些output作为生成feature map的参考。在解码器分支上采样和element-wise后，添加1x1卷积层，以增强学习能力，并保持特征的平滑性

每个TUM结构中的所有输出都形成当前level的多尺度特性。从整体上看，堆叠的TUMs输出形成多层次的多尺度特征，而前面的TUM主要提供浅层特征，中间的TUM提供中层特征，后面的TUM提供深层特征。

看M2Det的图，感觉TUM是把feature map变小了之后又变大了，但是论文里面的解释我只看到：把feature map进行多次卷积然后得到了多个scale 的feature map，没看出来有放大的过程。不明白是怎么回事……

SFAM

把在TUM中得到的多种特征按照不同的scale进行contact，得到尺度丰富的feature map，完了你就可以去做分类和检测了。

但细节上是把SFAM分成两部分了，第一部分是把相同的尺度进行连接。第二部分做了智能处理，用channel-wise模块，鼓励特性将注意力集中较为重要的通道上。使用SENet模型。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
M2Det的学习过程

不全，待补充主要框架：分析解释这个框图：M2Det主要是有三部分组成，主干网络、MLFPN(muli-level 的FPN、以及预测层。其中主干网络是用两个尺度进行特征提取。将这两个尺度的特征合并输入到MLFPN中MLFPN则由三部分组成，FFM、TUM、SFAM。FFMFFMv1是对主干网中提取出来的内容进行合并，得到base feature。FFMv2是用来...
复制链接

扫一扫

绿小油 CSDN认证博客专家 CSDN认证企业博客

码龄9年

23: 原创

15万+: 周排名

101万+: 总排名

2万+: 访问

: 等级

466: 积分

7: 粉丝

37: 获赞

7: 评论

40: 收藏

私信

关注

最新评论

WPS公式编辑器
郑辉辉: 非常好的UI设计，是我的大脑停止旋转
2019/6/4CS231n课程笔记（反向传播和神经网络）
太气了准备莱万汀: 关于max的雅克比矩阵（行为y，列为被求导的x）为什么一定是对角阵，我的理解是对于任何一个x，max(0, x)的输出只会与这个x有关，也就是说任意一行/一列最多只会有x这一个元素与梯度计算有关；max(0, x)的梯度可能为0，也可能为x，因此我们也可以知道对角线上的梯度值可能为1（x>=0）或者为0(x<0）
M2Det的学习过程
Thecoastlines: 大佬牛批
pytorch环境numba安装包安装失败，llvmlite安装失败！
luma8442: 真是绝了太感谢了楼主了
2019/8/14Faster RCNN自学记录
石湖一叶: 请问博主有把faster rcnn的代码跑通一遍吗

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。