上一篇介绍了CNN基本概念和卷积的知识,CNN的特征抽取除了包含卷积,还包含池化。
池化
池化又叫子采样,是特殊的卷积。池化比较好理解,还是上篇公司工作交接的例子,每个销售区域有100个老员工,我们可以先推举一个最懂本区域的业务人员参与交接(如各区域的领导),其他人员不必参与交接;或者每个区域内部先开一个会,把100个老员工的经验结合在一起,生成一个会议纪要,根据这份纪要与新员工交接。这实际对应两种池化方式,前一种是最大化池化,后一种是平均池化。
放到图像识别的例子里,池化是为了降维。例如一个250*250像素的图像,从上到下、从左到右用2*2大小的矩阵扫描,也就是说250*250的图像中每个连在一起2*2的小图像,都用这四个点中像素值最大的点代替,其他像素点舍弃;或者用这四个像素值的均值代替,也就完成了池化。注意平均池化实际相当于卷积核元素都是1的矩阵。
以上图为例,池化以后图像会变模糊,高、宽变为原来的一半。
结构
之所以没在本篇开头说结构,是因为希望大家一开始有个感性的认识,知道卷积是为了做什么,池化是为了做什么,否则一开始看结构会不知所云,不便于理解。
在了解卷积、池化以后,CNN的结构就比较简单了,首先它依然有输入层和输出层,输入层是一个矩阵,接收图像的二维矩阵信息(此处图像只考虑一个通道),经过卷积、池化、卷积、池化…