Network in Network

最新推荐文章于 2021-09-05 21:39:54 发布

Rainbow0618

最新推荐文章于 2021-09-05 21:39:54 发布

阅读量230

点赞数

分类专栏：论文笔记

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/fengtanyu3470/article/details/79078276

版权

论文笔记专栏收录该内容

1 篇文章 0 订阅

订阅专栏

这篇文章感觉相当重要，在GoogLeNet里被多次提及。而且它是基于最基本的CNN进行优化，有一定的普适性。

两个重要特点

mlpconv layer
优点：能够提升 abstraction level，就是说辨识不同数据之间相同实质的能力，说白了就是非线性部分增多了，当然更符合实际。
global average pooling
把FC改成了：将feature map求均值，然后放入softmax最后输出。按照文章的说法这样比FC更interpretable。同时，还能避免overfitting

details

下图是整体结构
这里写图片描述
1. universal function approximator
radial basis network和multilayer perceptron是两个常用的universal function approximator，选择后者有两个原因，一是它和CNN相契合，可以用反向传播算法来训练；二是它本身也是个深度模型，包含了特征重用的思想。
2. MLP convolution layer
这里写图片描述
文章还提到在跨通道情况(cross feature map)下，mlpconv等价于卷积层+1*1卷积层，此时的mlpconv也叫(cascaded cross channel parametric pooling)
3. global average pooling

we take the average of each feature map, and the resulting vector is fed
directly into the softmax layer

读后感

文章不长，但影响深远。比如里面提到的1*1卷积层，在后来著名的GoogLeNet和ResNet都采用了，不仅可以跨通道组织信息，而且可以进行升降维。

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。