计算机视觉学习笔记(三)---卷积神经网络基础


前言

  卷积神经网络的用途很广泛,包括检测任务、分类与检索任务、超分辨率重构、医学任务、无人驾驶、人脸识别等,在机器学习领域占领一席之地,本节介绍卷积神经网络的基础内容。


一、卷积神经网络的整体架构

  如下图是卷积神经网络的整体架构,分为四部分:输入层、卷积层、池化层、全连接层。
在这里插入图片描述

1.输入层

  卷积神经网络的输入是原始图像(三维矩阵),维度为height*width*depth,简称h*w*d。假设输入图片是32*32*3,分别对应h*w*d;其中对于图片输入来说通常是以RGB三通道的形式输入,即d为3。如下图所示。
在这里插入图片描述

2.卷积层

卷积层是如何工作的呢?
在这里插入图片描述

  假设我们输入的是5*5*3的图像,左上角的那个3*3*1是我们定义的一个卷积核,通过原始输入图像和卷积核做运算可以得到绿色部分的结果,怎么样的运算呢?左上角深色部分的中间数字是像素,右下角数字是卷积核的数字,对应相乘再相加即得到最终结果(即绿色图部分),例如:3*0+3*1+2*2+0*2+0*2+1*0+3*0+1*1+2*2=12

  那么当d大于1时是如何计算的呢?
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
  左边三个矩阵是输入Input,相当于d=3时有三个通道图,维度是5*5*3,当我们填充pad为1之后,即为7*7*3。现有两个卷积核,分别为Filter W0、Filter W1,卷积核维度是3*3*3,前两个维度是我们自己定的,大量实验证明3*3最好,最后一个维度3是和我们输入数据同维。通过原始输入图像和卷积核做运算最后相加就可以得到相应的输出,即Output。
  填充的目的是什么呢? 可以发现处于矩阵中心的数据在进行卷积的时候会被多次计算,即卷积核认为其更加重要,为了减少这种影响,我们认为在矩阵外围填充若干圈0,以使边缘数据也可以更多的参与卷积。
在这里插入图片描述

3.池化层

  由于多次卷积之后原始输入会变大,其中有很多无关紧要的输出并且浪费了很多算力,想要解决这个问题就需要我们进行池化操作。池化操作有两种,分别是最大池化和平均池化,根据任务需求进行选择池化方式。
在这里插入图片描述
在这里插入图片描述
  例如最大池化max-pooling,即将选中区域中的最大值选出,如上图所示。而平均池化mean-pooling即将选中区域数字相加之后计算平均值选出。

4.全连接层

  全连接层相当于在最后面加一层或多层传统神经网络(NN)层,我们在连接全连接层前,需要把我们的CNN的三维矩阵进行展平成二维,比如说从池化层出来的是5*5*3的图像,在输入到全连接层展平成1*75以满足全连接层的输入模式。


二、总结

  本文简要分析了卷积神经网络的组成,在下一篇文章中,将会用实际案例演示pytorch构建卷积神经网络用于训练的方法

  • 3
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
《Python学习笔记》是由皮大庆编写的一本关于Python语言学习的教材。在这本书中,作者详细介绍了Python语言的基础知识、语法规则以及常用的编程技巧。 首先,作者简要介绍了Python语言的特点和优势。他提到,Python是一种易于学习和使用的编程语言,受到了广大程序员的喜爱。Python具有简洁、清晰的语法结构,使得代码可读性极高,同时也提供了丰富的库和模块,能够快速实现各种功能。 接着,作者详细讲解了Python的基本语法。他从变量、数据类型、运算符等基础知识开始,逐步介绍了条件语句、循环控制、函数、模块等高级概念。同时,作者通过大量的示例代码和实践案例,帮助读者加深对Python编程的理解和应用。 在书中,作者还特别强调了编写规范和良好的编程习惯。他从命名规范、注释风格、代码缩进等方面指导读者如何写出清晰、可读性强的Python代码。作者认为,良好的编程习惯对于提高代码质量和提高工作效率非常重要。 此外,作者还介绍了Python的常用库和模块。他提到了一些常用的库,如Numpy、Pandas、Matplotlib等。这些库在数据处理、科学计算、可视化等领域有广泛的应用,帮助读者更好地解决实际问题。 总的来说,《Python学习笔记》是一本非常实用和全面的Python学习教材。通过学习这本书,读者可以系统地学习和掌握Python编程的基础知识和高级应用技巧,为以后的编程学习和工作打下坚实的基础

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

远山0128

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值