这篇博客是对Recent Advances in Convolutional Neural Networks这篇论文的一个解读感悟,不是翻译,只是解读。
简介
CNN从AlexNet,到VGG,GoogleNet,再到ResNet,网络层次不断在加深,而且拓扑结构也越来越复杂,其面临的目标优化、过拟合等问题也越来越难解决。
基本概念
卷积
卷积其实就是一个不断滑动的矩阵对应位置的点乘(不考虑旋转180°),然后加上bias,式中 l 表示层,i, j表示位置, k表示神经元序号。
激活层
激活层一般是原地操作,不需要与邻域相关,a表示一个非线性函数。(为什么要非线性?呵呵,如果是线性的,那么大家都是线性,叠加起来不还是线性吗?最后网络只学到了一个线性映射,特征表达能力太有限了吧?)
Pooling层
Pooling可以下采样,使得特征更稀疏,更显著(这是我的理解,原文没讲)。
未完待续