Xception论文阅读笔记

最新推荐文章于 2024-07-12 23:13:44 发布

萌新调包员

最新推荐文章于 2024-07-12 23:13:44 发布

阅读量426

点赞数

分类专栏：轻量级网络文章标签：神经网络深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/tuntunmmd/article/details/105969062

版权

轻量级网络专栏收录该内容

5 篇文章 0 订阅

订阅专栏

目录

原文链接：

网络结构改进：

Xception架构：

原文链接：

Xception: Deep Learning with Depthwise Separable Convolutions

发表时间：2017年

来源：CVPR

作者：François Chollet

简介：

本文提出了一种叫做xception的架构，该架构受Inception的启发，其中Inception模块被深度可分离卷积代替。Xception架构与Inception V3具有相同的参数量，性能却显著优于Inception V3。

网络结构改进：

Xception 受Inception的启发，是对 Inception-v3 的另一种改进。
作者做出假设：卷积神经网络特征映射中交叉通道相关性和空间相关性的映射可以完全解耦。所以采用可分离卷积来替换原来 Inception-v3中的卷积操作。

（1）典型的Inception模块（Inception V3）中，输入同时经过几个不同的特征提取结构进行特征提取，然后再做concat

（2）一个简化的Inception模块（除去Avg Pool结构）

（3）简化的Inception模块的严格等价重新配置

（4）Inception模块的“极致”版本，1x1卷积的每个输出通道具有一个空间卷积，即Xception

Xception与深度可分离卷积的区别

（1）操作顺序不同：通常实现的深度可分卷积执行第一个通道空间卷积，然后执行1x1卷积，而Inception首先执行1x1卷积。

（2）第一次操作后是否存在非线性：在Xception中，两个操作之后都有深度方向的ReLU非线性，而深度可分离卷积通常在没有非线性的情况下实现。

作者认为第一个区别并不重要，特别是因为这些操作旨在用于堆叠设置。第二个区别可能很重要。

Xception架构：

数据首先通过入口流，然后通过重复8次的中间流，最后通过出口流。请注意，所有的卷积和SeparableConvolution图层都遵循批量归一化BN（未包含在图中）

结论：

（1）Xception 在 ImageNet 上，比 Inception-v3 的准确率稍高，同时参数量有所下降

（2）在 Xception 中加入的类似 ResNet 的残差连接机制显著加快了Xception的收敛过程并获得了显著更高的准确率。

（3）在可分离卷积层的深度运算和逐点运算之间没有任何非线性会导致更快的收敛和更好的性能

萌新调包员

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
Xception论文阅读笔记

原文连接：Xception: Deep Learning with Depthwise Separable Convolutions简介：本文提出了一种叫做xception的架构，该架构受Inception的启发，其中Inception模块被深度可分离卷积代替。Xception架构与Inception V3具有相同的参数量，性能却显著优于Inception V3。网络结构：...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。