本论文追求的不是准确率的提高,而是不降低准确率的前提下,减少参数数量,寻找更有的结构;
这篇论文是不错的实验模仿对象,以后做实验可以按照本论文的思路探索;
动机
-
要解决什么问题?
-
- 探寻Inception的基本思路,并将这种思路发扬光大。
-
用了什么方法解决?
-
- 从Inception发展历程的角度,理解其基本思想,并引入与Inception类似的Depthwise Separable Convolution结构。
- 将Inception V3结构中的Inception改用Depthwise Separable Convolution。
-
效果如何?
-
- 在与Inception V3参数数量相差无几的情况下,在ImageNet上性能有略微上升,JFT上有明显提高。
-
还存在什么问题?
-
- Depthwise Separable Convolution不一定就是最优结构,还有尚未探索、验证的相似结构。
假设
- corss-channels correlations 和 spatial correlations是分开学习的,而不是在某一个操作中共同学习的。
优势
- Xception是Inception家族中一员。