06 卷积神经网络CNN-学习笔记-李宏毅深度学习2021年度

上一篇:05 Classification-学习笔记-李宏毅深度学习2021年度

下一篇:07 Self Attention-学习笔记-李宏毅深度学习2021年度

本节内容及相关链接

CNN的相关概念

课程笔记

卷积神经网络(Convolutional Neural Network,CNN)是专门为图片识别设计的,当然也可以用在其他的任务上


卷积层:将图片各区域依次与多个Filter进行内积(inner product)操作,最终获取一个新的图片

Filter: 一个( h × w × channels h\times w \times \text{channels} h×w×channels )的Tensor,通常宽高一致,且不宜过大,取 3 × 3 × channels 3\times 3 \times \text{channels} 3×3×channels 即可,其中channel要和图片的channel保持一致

Filter是用来提取图片的特征的

例如,对一张彩色图片做卷积,则Filter的维度可以设置为: 3 × 3 × 3 3\times 3 \times 3 3×3×3
在这里插入图片描述

Filter也是有bias的,一个Filter有一个Bias,只不过通常不

stride:步长,只卷积过程中,Filter每次往后移动多少步;stride通常不会太大,1或2即可

卷积后生成的图片矩阵称为Feature Map


卷积的过程,可以使用神经网络完成

在这里插入图片描述

  • Filter中的数对应神经网络的权重
  • 图片中的数对应神经网络的输入
  • 多个Filter相当于有多个神经元

Subsample(下采样): 将图片缩小,减小参数个数。在CNN中,称为Pooling

最常见的Pooling策略

  • Max-Pooling:在某区域的像素中,采取像素值最大,其他的都丢弃

整个CNN过程如下:

  1. 将图片转为Tensor
  2. 使用多个Filter对图片Tensor进行卷积
  3. 对卷积后的Feature Map进行Pooling也可以不进行Pooling,视情况而定
  4. 可以对(2),(3)步进行多次
  5. 将Tensor转为Vector,即将图片拉平,该动作称为Flatten
  6. 将第5步生成的Vector输入到Fully Connected Neural Network,进行接下来的事情

在这里插入图片描述


CNN的局限:泛化能力差,例如对图片进行放大后,可能就识别不出来了
在这里插入图片描述

假设都是使用第一种类型的图片进行训练,那么CNN对第二种就无法识别

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

iioSnail

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值