CNN-卷积神经网络

本文介绍了卷积神经网络(CNN)在图像处理中的使用,主要因其能有效减少参数数量和简化网络架构。CNN通过卷积层和最大池化层逐步提取特征,降低图像尺寸,用于图像识别任务。通过多次卷积和池化,网络能够学习到图像的局部特征,如鸟嘴、爪子等,从而实现高效识别。此外,还讨论了CNN的flatten层和全连接层的作用,以及如何通过调整网络结构来优化模型。CNN广泛应用于围棋、语言处理等多个领域。
摘要由CSDN通过智能技术生成

为什么要用cnn

在这里插入图片描述
当我们在训练的时候,我们会期待每个神经网络都是一个分类器,比如说第一层是最简单的分类器,它做的事情是判断有没有红色出现,
第二层会比较复杂,它根据第一层的输出,来判断
第三层根据第二层的输出来进行判断
但是出现一个问题,当我们用完全连接的前馈网络来做图像处理的时候,往往我们会需要很多的参数,比如说一张图片(100100),把它变成一个向量,就是3100*100,维度就很大,这样造成最后的参数就很多,而cnn做的是这样一件事情,简化神经网络的架构,将有些不必要的特征给剔除掉。这样会方便很多。
在这里插入图片描述
为什么我们可以把一些参数拿掉,
就拿鸟的图片举例来说,第一个隐藏层的工作就是侦测有没有鸟嘴的存在,有没有爪子,尾巴的存在,合起来就可以判断一只,而如果说只侦测一个部位,那么每个神经元连接一小块区域就行,就不用连接到完整的图
在这里插入图片描述
在这里插入图片描述
当我们的图片缩小的时候,其实对训练没有影响的 ,而这样做是可以减少我们的参数的。

cnn架构

在这里插入图片描述
整个CNN的架构是这样的,首先input一张image以后,这张image会通过convolution layer,接下来做max pooling这件事,然后在做convolution,再做max pooling这件事。这个process可以反复无数次,反复的次数你觉得够多之后,做完决定要做的convolution和Max Pooling以后,你要做另外一件事,这件事情叫做flatten,再把flatten的output丢到一般fully connected feedforward network,然后得到识别结果。
在这里插入图片描述
假设我们input的是一张66的图片,一个像素就是可以用一个值来描述,1代表有墨水,0代表没有,再convolution layer里面,它由一组filter,来进行筛选,每个fitlter会筛出一个pattern
在这里插入图片描述
将filter往右移动一格得到-1,再往右移动一格得到得到-3,再往右移动一格得到-3,依此类推,当移到右下角的时候得到-1.
经过这件事后,本来6
6的矩阵,变换成4*4的矩阵,这个矩阵的左上和左下会出现最大的值。
就代表说这个filter要侦测的值就在这个image的左上角和左下角。
在这里插入图片描述
一个convolution layer里面会有很多个filter,不同的filter有不同的参数,最终也会提取多少个参数。

max pooling

在这里插入图片描述
在这里插入图片描述
max pooling做的是将filter出的矩阵选择他们的平均或者选最大的,就可以将多个值合成一个值,这样就可以将图片缩小。
在这里插入图片描述
在这里插入图片描述
池化之后,就将原来的66变成了22的image
在这里插入图片描述
这件事可以重复很多次,通过一个convolution+max pooling 得到新的image,这个image比较小,再做同样的操作,可以得到一个更小的image,
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

cnn学到了什么 cnn

在这里插入图片描述
我们提取12个filter出来,每个filter都去找一张image,这个image可以让fitle的activation最大,现在有50个fitlter,就要找50张image,让这些filter的activation最大。在这里插入图片描述
在做完convolution和max pooling 以后,先做flatten, 将flatten的结果丢到神经网络中,我们想知道在神经网络中,每个neural的工作什么,
我们定义第j个neural,它的output叫a[j],我们找一张image,这个image X丢到神经网络中,它可以让这个a[j]的值被maximize,如下图
在这里插入图片描述
在这里插入图片描述

让图更像数字

在这里插入图片描述
我们怎样让这个图看起来更像数字呢?
我们可以给机器预先设定一些限制,比如说图中白色的亮点代表的是有墨水的,对一个数字来说,一张图的某个小部分会有笔画,所以我们对这个x做一些限制。

CNN的应用

1.围棋
2.alphago
3.语言
4.文本

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值