17天之深度学习task04CNN(卷积神经网络)

卷积的含义

  • 局部不变性:尺度缩放、平移、旋转不改变语义信息;
  • 自然图像中的物体大多数都有局部不变性,但是前馈神经网络很难提取到局部不变特性,所以提出来卷积神经网络

CNN基本原理

卷积神经网络的基本结构大致包括:卷积层、激活函数、池化层、全连接层、输出层等

其他卷积模型

转置卷积 (低维特征映射到高维特征)
空洞卷积
  • 为了增加输出单元的感受野,通过给“卷积核”插入空洞变相增加其大小
  • 扩张卷积与普通卷积的相同点在于,卷积核的大小是一样的,在神经网络中即参数数量不变,区别在于扩张卷积具有更大的感受野
    在这里插入图片描述
  • 第一幅图中卷积核是33,第二幅图采用插入空洞的方式使33的卷积核变为5*5,其中dilation rate(扩张率) = 1,第三幅图中dilation rate(扩张率)=2;
感受野分析

在这里插入图片描述

  • 上面是普通卷积操作

在这里插入图片描述

  • 上面是插入空洞的卷积操作

上采样与下采样

上采样(放大图像/图像插值)
  • 常用方法:双线性插值(bilinear),反卷积(Transposed Convolution),反池化(Unpooling)
  • 原理:图像放大几乎都是采用内插值方法,即在原有图像像素的基础上在像素点之间采用合适的插值算法插入新的元素。除此之外,插值算法还包括了传统插值,基于边缘图像的插值,还有基于区域的图像插值。
下采样(降采样/缩小图像)
  • 原理:池化
  • 分为最大池化均值池化
  • 池化层不包含需要训练学习的参数,仅需指定池化操作的核大小、操作步幅以及池化类型
    在这里插入图片描述

卷积层作用

在这里插入图片描述

卷积的模式

在这里插入图片描述

激活函数

  • 在卷积神经网络中,最常用的是RELU,不太常用sigmod函数

在这里插入图片描述

优缺点

在这里插入图片描述

特征图

浅层卷积层:提取图像基本特征:比如纹理、方向
深层卷积层:提取的是图像高阶特征,出现了高层语义模式,如“车轮”、“人脸”等特征

全连接层

  • 对卷积层和池化层输出的特征图(二维)进行降维
  • 将学到的特征表示映射到样本标记空间的作用

输出层

在这里插入图片描述

卷积神经网络的训练

  • Step 1:用随机数初始化所有的卷积核和参数/权重
  • Step 2:将训练图片作为输入,执行前向步骤(卷积, ReLU,池化以及全连接层的前向传播)并计算每个类别的对应输出概率。
  • Step 3:计算输出层的总误差
  • Step 4:反向传播算法计算误差相对于所有权重的梯度,并用梯度下降法更新所有的卷积核和参数/权重的值,以使输出误差最小化

经典的卷积神经网络结构

在这里插入图片描述

1. LeNet-5

在这里插入图片描述
在这里插入图片描述

2. AlexNet

  • 首次成功应用ReLU作为CNN的激活函数
  • 使用Dropout丢弃部分神元,避免了过拟合
  • 使用重叠MaxPooling(让池化层的步长小于池化核的大小), 一定程度上提升了特征的丰富性
  • 使用CUDA加速训练过程
  • 进行数据增强,原始图像大小为256×256的原始图像中重 复截取224×224大小的区域,大幅增加了数据量,大大减轻了过拟合,提升了模型的泛化能力
    在这里插入图片描述
    在这里插入图片描述

3. VGGNet

  • 比较常用的是VGG-16,结构规整,具有很强的拓展性
  • 相较于AlexNet,VGG-16网络模型中的卷积层均使用 333∗3 的 卷积核,且均为步长为1的same卷积,池化层均使用 222∗2 的 池化核,步长为2

在这里插入图片描述

4. Inception Net

在这里插入图片描述

5. ResNet

在这里插入图片描述
在这里插入图片描述

6. Densenet

  • DenseNet中,两个层之间都有直接的连接,因此该网络的直接连接个数为L(L+1)/2。
  • 对于每一层,使用前面所有层的特征映射作为输入,并且使用其自身的特征映射作为所有后续层的输入
    在这里插入图片描述

在这里插入图片描述

CNN应用

图像方面

  • 图像分类(物体识别):整幅图像的分类或识别
  • 物体检测:检测图像中物体的位置进而识别物体
  • 图像分割:对图像中的特定物体按边缘进行分割
  • 图像回归:预测图像中物体组成部分的坐标

语音识别

自然语言处理

  • 比如情感分析
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
深度学习中的卷积神经网络CNN)是一种重要的神经网络结构,主要用于图像处理、视频处理、音频处理和自然语言处理等领域。卷积神经网络的概念早在上世纪80年代就被提出,但直到21世纪以后,随着深度学习理论的完善和硬件性能的提升,卷积神经网络才真正崛起。如今,卷积神经网络深度学习领域扮演着举足轻重的角色,许多重要应用如AlphaGo和手机上的人脸识别都采用了卷积神经网络。\[1\] 在理解卷积神经网络之前,我们需要先了解神经网络的基础知识。卷积神经网络是一种专门用来处理具有类似网格结构的数据的神经网络,例如时间序列数据和图像数据。卷积神经网络中的“卷积”指的是一种特殊的线性运算,它在网络的一层中使用卷积运算来替代一般的矩阵乘法运算。这种运算在许多应用领域都表现出色。\[3\] 总结来说,深度学习中的卷积神经网络是一种用于处理具有网格结构数据的神经网络,通过卷积运算来替代矩阵乘法运算,以实现对图像、视频、音频和自然语言等数据的高效处理。\[1\]\[3\] #### 引用[.reference_title] - *1* *2* [深度学习——卷积神经网络CNN)简介](https://blog.csdn.net/johnny_love_1968/article/details/117636049)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insertT0,239^v3^insert_chatgpt"}} ] [.reference_item] - *3* [深度学习卷积神经网络(Convolutional Neural Networks)](https://blog.csdn.net/qq_28505705/article/details/102944765)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insertT0,239^v3^insert_chatgpt"}} ] [.reference_item] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值