这周完整的把《深度学习入门》学完了,重点学习了「卷积神经网络」并通过调试代码的方式把前面的内容复习了一遍。
概念
- 特征图(feature map):卷积层的输入输出数据
- im2col(image to column):将输入数据展开以适合滤波器(权重)的函数,其输出结果为2维矩阵。
im2col (input_data, filter_h, filter_w, stride=1, pad=0)
卷积神经网络(Convolutional Neural Network, CNN)
在神经网络中新增了「卷积层」(Convolution)和「池化层」(Pooling)。在这之前,需要先了解下之前神经网络中运用到的全连接层。
全连接(fully-connected)
在全连接层中,相邻层神经元全部连接在一起,如Affine层,其输入数据需要为1维数据。
这就导致了数据的「形状」被忽略了。比如图像是包含通道、高、宽的3维形状,但输入全连接层(Affine层)时则需要将其排成1列(MNIST数据集是784个数据)。
卷积层可以保持输入数据的形状不变。
卷积运算
在卷积层进行的处理就是「卷积运算」,相当于图像处理中的「滤波器运算」,进行「乘积累加运算,即将各个位置上滤波器的元素和输入的对应元素相乘后再求和。<