深度学习笔记(4):1.6-1.8 简单卷积网络

1.6 对立方体做卷积(convolutions over columes)

这一小节我们讲对立方体做卷积,图片从2D的灰度图像变为3D的RGB彩色图像,这三层分别对应红绿蓝三个通道,如下图所示:

图片规模由6*6变为6*6*3,这三个数字分别表示图片的高、宽和通道的数目(#channels)。图片规模由2D变为3D,filter规模也跟着由2D变为3D的3*3*3,这三个数字表示filter的高、宽和channel的个数,因为原图有几个通道,filter也需要跟着变化,最后一个值二者必须相等,通过卷积操作后,我们可以得到一个4*4的二维图像,这是怎么实现的呢?

上图中左侧图片因为老师的动态演示有些不清晰,其实它展示的是下个PPT中显示的红绿蓝三通道。通道有三个,filter也有三层,因为这两个值是必须相等的,在这种情况下该如何计算卷积呢?很自然的类比法,同二维的计算类似,只是这次我们将filter看做一个整体,即一个立方体(volume),将原图也看作是一个立方体,然后将整个filter立方体嵌入原图中进行卷积运算,只不过这次不是将3*3=9个element-wise的乘积求和,而是将3*3*3=27个element-wise的乘积求和,同时,在不加入padding和stride的情况下,即默认步长为1,我们可以得到一个4*4的输出结果。

那现在我们知道了filter有三层,也知道分别对应原图中的红绿蓝三个通道,我们就可以根据我们的目的对filter参数采取一些特定操作,比如假设我们仅仅关心红色的垂直边缘检测,我们就可以仅将第一层filter设为垂直边缘检测器,而将后两层filter的参数均设为0;或者说我们对三种颜色的垂直边缘检测都比较感兴趣,我们就可以将三层的filter都设为垂直边缘检测器,如上图所示。

除了在一个filter中对不同层进行一些不同的操作,我们还可以根据目的采取多个不同功能的filter,如下图所示:

假设我们不仅关心垂直边缘检测,我们还关心水平边缘检测,甚至45度的边缘检测,我们该怎么办呢?

这时,我们可以使用多个不同功能的filter,可以使用10个、128个等等。上图我们仅考虑了两种功能的filter,即垂直边缘检测和水平边缘检测,我们用不同颜色标示以表示区别。黄色在这里表示有垂直边缘检测功能的filter,原图通过和这个filter进行卷积运算得到一个输出结果,显示出垂直边缘,橙色表示有水平边缘检测功能的filter,输出结果显示水平边缘,然后我们把这两个filter得到的输出结果叠在一起得到一个4*4*2的立方体。

最后我们再总结一下,原图的规模是n*n*n_C,n_C表示the number of channels,就是通道的个数,filter的维度是f*f*n_C,在没有padding和stride的影响下,输出结果的维度是(n-f+1)*(n-f

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值