卷积神经网络week1笔记

本文主要介绍了卷积神经网络在计算机视觉中的应用,包括图片分类和物体检测等。详细讲解了卷积层的边缘检测、padding的作用、stride的概念以及参数计算。还提到了池化层的类型和卷积神经网络的结构,如LeNet-5,并阐述了使用CNN的原因,如参数共享和稀疏连接。
摘要由CSDN通过智能技术生成

1.计算机视觉问题

包括图片分类,物体检测,神经风格迁移等等。对于比较大尺寸的图片,普通的神经网络可能不再适用,这时候运用卷积神经网络。

 

2.边缘检测示例

神经网络前几层检验处边缘,后面几层检测出物体的部分,再后面几层检测出完整物体。一张图片进行垂直或者水平边缘检测会出现如上结果。

这里举了垂直边缘检测的例子。filter如图所示。生成的矩阵高于一定阈值的部分就是边缘,因为此处图片较小所以边缘不是很清楚。

 

3.padding

如果不padding,边缘信息进行运算次数较少,导致部分信息丢失。n*n的图片经过f*f算子,缩小成(n-f+1)*(n-f+1)的图片。

padding即在边缘进行填充,值记为p。输出图片为(n-f+1+2p)*(n-f+1+2p)。

tensorflow中valid padding指p=0;same padding指输出图片和输入图片一样,因此p=(f-1)/2,f一般为奇数。

 

4.stride

stride指算子一次移动的距离,记为s,默认为1。

如果s不为1,若移动的窗口最后落在图片外面,则舍去该项。

 

5.参数个数

preview

假设有10个3*3*3卷积核,参数个数为10*(3*3*3+1)=280

 

6.标记总结

7.简单神经网络示例

卷积神将网络分为卷积层,池化层,全连接层。

 

8.池化层

池化层没有需要学习的参数,分为最大池化和平均池化。输入输出如下

9.卷积神经网络示例

这里给出了LeNet-5的例子

10.使用卷积神经网络的原因

参数少:图中例子卷积神经网络需要6*(5*5+1)=156个参数,而全连接需要3072*4704约14m个参数

preview

参数共享:一个特征检测器(例如一个垂直边缘检测器)可能对图片多个部分有用

连接的稀疏性:每层每个输出只取决于一小部分的输入。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值