CNN学习笔记(一)

CNN学习笔记(一)

卷积神经网络概述

卷积神经网络(convolutional neural network)听起来似乎很复杂,像是生物,计算机,数学的奇特结合。神经网络在 2012 年崭露头角,Alex Krizhevsky 凭借它们赢得了那一年的 ImageNet 挑战赛(大体上相当于计算机视觉的年度奥林匹克),他把分类误差记录从 26% 降到了 15%,在当时震惊了世界。

为什么卷积神经网络适合做图像的处理呢?

当计算机看到一张图像时,实际上是看到是一大堆像素值。比如一张分辨率为28×28的图片,输入计算机中,就是一个28×28×3的数组(3指代RGB值)。
如果使用传统的神经网络(全连接):
在这里插入图片描述

我们输入的28×28的图片,数据量就是28×28×3,那么图片的特征向量的维度2352。当然现在的图片分辨率都很高,28×28还是比较小的,如果操作更大的图片,比如一张 1000×1000 的图片,那么特征向量的维度达到了 1000×1000×3,因为有 3 个 RGB 通道,所以数字将会是 300 万。

如果特征维度为300万,那么我们的神经网络需要300万个输入,如果神经网络的隐藏层有1000个隐藏单元,那么输入层和第一个隐藏层之间的参数矩阵的大小是会有 30亿个参数,仅仅输入层和隐藏层之间就有30亿个参数。在参数如此大量的情况下,难以获得足够的数据来防止神经网络发生过拟合,而且还存在巨大的计算压力。因此我们需要一个网络模型,它可以有效的降低参数,防止过拟合和现象并且减少运算压力,这样CNN就被提出了。

我们需要计算机做什么?
计算机能区分开所有提供给它的图片,搞清楚给出的东西的特征,比如看到鸟的喙或者羽毛,猜这大概是一只鸟。
鸟

这也是我们人类的大脑中不自觉进行着的过程。当我们看到一幅狗的图片时,如果有诸如爪子或四条腿之类的明显特征,我们便能将它归类为狗。同样地,计算机也可以通过寻找诸如边缘和曲线之类的低级特点来分类图片,继而通过一系列卷积层级建构出更为抽象的概念。这是 CNN(卷积神经网络)工作方式的大体概述。

下一篇是具体每个步骤的细节 关注防止走丢
CNN的主要步骤:
卷积层-Pooling-卷积层-Pooling-全连接层-softmax

  • 4
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

magicwindyyd

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值