计算机视觉中的深度学习7: 卷积神经网络

Slides:百度云 提取码: gs3n

之前说了全连接神经网络,说了线性分类,这些东西全都没有保留图片原本的2D特性,全都是将图片转化为1D的数组。

而今天说的CNN,则是能更好地保留图片的2D特性,在CV中有着更广泛地运用。

卷积层

对于一个32x32x3的一个图片,全连接层将它平摊成一个3072x1的数组
在这里插入图片描述
对于同样的图片,卷积层则是这么做的

它通过一个和输入图片同样高的filter,让filter与输入图片进行卷积,得出了一个28x28x1的新的图片
在这里插入图片描述
同时,我们可以有多个filter,从而产生多个输出图片

那么这儿共有6个filter,输出则是6组图像,你可以将这6组图像当做一个6x28x28的三维新图片
在这里插入图片描述
将其串联起来就是如下的结构
在这里插入图片描述

输入输出的大小关系

我们可以明显得看出来

  1. 关于高度
    1. 输出的高度与输入的高度无关,只与filter的个数有关
    2. filter的高度和输入的高度一致
  2. 关于长宽
    1. 输入的长W,filter长K,输出则为 W − K + 1 W-K+1 WK+1
    2. 同理宽

我们可以看到经过多轮卷积层的处理,图片会越来越小,每次特征图片的处理都会损失更一些大小。这样可能会造成,对于一个太深的神经网络,处理到后期,图片就变成1x1的大小而无法被处理了。

Padding

在图片周围加入一些0

在这里插入图片描述

  1. 关于长宽的计算
    1. 输入的长W,filter长K,padding大小P,输出则为 W − K + 1 + 2 P W-K+1+2P
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值