【计算机视觉与深度学习 北京邮电大学 鲁鹏 视频笔记】3.卷积神经网络&经典网络分析

在这里插入图片描述

1. 卷积神经网络

  • 全连接神经网络的瓶颈
    图越大,参数越多,计算复杂,容易过拟合。
    在这里插入图片描述
  • 卷积神经网络的主要层
    在这里插入图片描述

1.1 卷积网络中的卷积核

1.1.1卷积核

在这里插入图片描述

  • 卷积神经网络中的卷积操作
    在这里插入图片描述
    在这里插入图片描述
    在多加几个卷积核

在这里插入图片描述

在这里插入图片描述

  • 卷积核的步长(stride)
    在这里插入图片描述
    由此可见卷积后图像变小,所以要边界填充
    在这里插入图片描述
    在这里插入图片描述
  • 特征响应图组尺寸计算
    在这里插入图片描述

1.1.2 池化操作

在这里插入图片描述
1.减少运算量2.增大感受野3.非极大抑制

  • 池化操作是对每一个特征响应图独立进行
    在这里插入图片描述
  • 对应特征响应图某个区域进行池化就是在改区域上指定一个值来代表整个区域(有点类似于非极大抑制

进行操作后,特征响应图中的75%的响应信息都丢掉,但不改变特征响应图的个数。
在这里插入图片描述
在这里插入图片描述

1.1.3 图像增强

在这里插入图片描述

  • 增强操作
    1)镜像
    在这里插入图片描述
    2)随机缩放&抠图
    在这里插入图片描述
    3)色彩抖动
    在这里插入图片描述

    在这里插入图片描述

2. 经典网络解析

2.1 AlexNet

更早的是LeNet5
用于解决非常简单的问题
在这里插入图片描述

2012年提出,在ImageNet大规模视觉识别挑战赛冠军,精度提升超过10个百分点
在这里插入图片描述
在这里插入图片描述
比赛中精度
在这里插入图片描述
在这里插入图片描述
1)AlexNet的结构
在这里插入图片描述
其中,网络输入之前要去均值
第一层CONV1
在这里插入图片描述
第二层MAX POOL
在这里插入图片描述
第三层NORM1
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
池化层
在这里插入图片描述
最后全连接层
在这里插入图片描述
重要说明
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
问:
在这里插入图片描述

## 2.2 ZFNet

在这里插入图片描述
在这里插入图片描述

2.3 VGG

在这里插入图片描述
在这里插入图片描述
思考:
1)
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
2)
在这里插入图片描述
3)
在这里插入图片描述

2.4 Google Net

在这里插入图片描述
GoogleNet的主要创新
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
优点:层数更深,参数更少,计算效率更高、非线性表达能力也更强。

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

2.5 ResNet

在这里插入图片描述
为解决这一问题,提出残差网络
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
问:为什么残差网络性能这么好
在这里插入图片描述

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值