卷积神经网络的直观解释(笔记)

原文地址:请戳这里
译文地址:请戳这里


这篇博文让我对卷积神经网络有了更好的理解,我把要点整理在这里,供以后回顾:
如果你对神经网络也不是很熟悉的话,请戳这里


卷积神经网络( ConvNets或者CNNs)是神经网络的范畴。

应用领域:图像识别、语音识别、自然语言处理(如语句分类)。可以识别人脸、物体和交通信号,从而为机器人和自动驾驶汽车提供视力。也可以识别场景,提供相关的标签。


LeNets架构(1990s)

LeNets是最早的卷积神经网络。
经过多次成功迭代,1998年,Yann LeCun 把这项工作命名为LeNets5。该架构主要用于字符识别,如邮编,数字等。

卷积神经网络如下图所示:

这里写图片描述

主要有四个操作:

  1. 卷积
  2. 非线性处理(ReLU)
  3. 池化或亚采样
  4. 分类(全连接层)

图像是像素值的矩阵

这里写图片描述

通道:用于表示图像的某种组成。一个标准数字相机拍摄的图像会有三通道 - 红、绿和蓝;你可以把它们看作是堆在一起的深度为3的二维矩阵(每一个通道代表一个颜色),每个通道的像素值在 0 到 255 的范围内。

灰度图像:仅仅只有一个通道,就是一个普通的二维矩阵。矩阵中各个像素的值在 0 到 255 的范围内——零表示黑色,255 表示白色。

卷积

卷积的目的:为了从输入图像中提取特征。卷积可以通过从输入的一小块数据中学到图像的特征,并可以保留像素间的空间关系。

原始图像:

  • 6
    点赞
  • 22
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值