卷积神经网络--卷积层(斯坦福李飞飞学习笔记)

卷积核

对于图像分类任务,常见的卷积核(kernel)大小可以是3x3、5x5个像素点

注意一下词汇的辨析:

kernel是二维的,也就是每一层的卷积核大小;filter表示的是三维的,所以可以看到ppt里面的filter展示的是5*5*3,因为kernel的大小是5*5,同时放入的图像是RGB类型,总共3个像素层,所以三维的filter如下图所示:

image:32*32*3(图像大小32*32像素点,RGB图片总共3个颜色通道)

filter:5*5*3(滤波器大小5*5像素点,3个颜色通道)

kernel:5*5(卷积核大小5*5像素点)

slide:通常指的是卷积操作中滤波器(filter)在输入数据上的移动过程,涉及将一个小的窗口(这里是滤波器)在输入数据(如图像)的二维空间中滑动

卷积层示意图(convolutional layer):

filter的数量可能不止一个,在神经网络的卷积层中,通常会定义多个卷积核来同时从输入图像中提取不同的特征。每个卷积核都可以学习不同的特征,比如边缘、角点、纹理等。如果说有6个卷积核,那么就有6个独立的5x5x3的滤波器,每个滤波器通过卷积操作生成一个特征图(也称为输出通道),如下图所示:

  • 想在这里补充一下关于深度可分离卷积的里的深度卷积的概念:

深度可分离卷积分为:深度卷积和逐点卷积

其中深度卷积和标准卷积(也就是上面介绍的部分)不相同,为单通道模式,即对输入的RGB图像的三个通道分别有三个kernel(卷积核)(如下图,一个RGB图片的三个通道总共只会被识别一次)

逐点卷积则是对于刚刚针对RGB三个通道生成的(28*28*1的activation maps进行进一步的卷积处理);

最后得到的结果是:

深度分离卷积整体示意图:

而标准的卷积为:

RGB图像三个通道用一个filter(滤波器),可以有多个滤波器识别不同的特征。(如下图,整个RGB的三个通道会被识别三次)

(后续慢慢更新)

  • 8
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值