一、在RGB图像上的卷积
3表示通道数目,图像中的通道数目必须等于过滤器中的通道数目
卷积核的维度是3*3*3,不是简单的矩阵的叠加,有时候,会把这个画成三位立方体
卷积计算过程:用立方体中的每个数字分别与图像的红绿蓝三通道的对应数字相乘
对应数字相加,就可以得到4*4矩阵中的第一个数字
如果想要检测图片里的红色通道的边缘:
检测任何颜色的边缘:
多个卷积核(过滤器)得到多个输出,不同的过滤器可能有不同的特征提取作用
总结:
一直在用通道(channel)数量作为最后一个维度,在某些文献中,称之为3D立方体的深度
二、单层卷积网络
与非卷积神经网络对比:
这里的a[0]就是6*6*3的图像输入,过滤器的作用和w[1]类似,偏置项b和b[1]的作用类似,再经过激活函数,得到输出a[1]
练习
一共有280个参数要学习,优点是不论输入图像时1000*1000还是5000*5000,都只有这280个参数
用这10个过滤器检测不同的特征,比如水平边缘线、竖直边缘线或其他不同的特征,不管图片多大,所使用的参数都是一样的的,这个特征使得卷积神经网络不太容易 过拟合
用l表示第l个卷积层
f[l]表示第l层的过滤器的维度,p[l]表示第l层填充,s[l]表示步长,nc[l]表示过滤器的数目
Input:接收的是上一层卷积层输出的图像特征的维度
上图中还给出了怎么计算当前层的输出图像的长度和宽度,输出通道数就等于过滤器的数目
Each filter:通道数应该与输入图像的通道数一致
Activations:与输出图像的维度保持一致
A[l]:梯度下降
Weights:所有过滤器的权重的维度就是所有的过滤器的大小总和,过滤器的数目由当前层决定,每个过滤器的通道数由上一层输出图像的通道数决定