深度学习笔记(四):卷积神经网络week1--卷积神经网络

1.计算机视觉1.1 计算机视觉的3个问题(1)图像分类图像分类是一个在工业界广泛使用的需求,从最早的识别手写数字,邮编到现在的人脸识别。(2)物体检测目前物体检测的应用也相当广泛。比如通过城市与道路上的监控视频可以实时捕捉车辆,行人的动态;再比如自动驾驶汽车中也是通过车身上大量摄像头去捕捉周围的环境状况,从而做出相应合理的响应。(3)风格迁移这是近几年火了一段时间的风格迁移,虽...
摘要由CSDN通过智能技术生成

1.计算机视觉

1.1 计算机视觉的3个问题

(1)图像分类
图像分类是一个在工业界广泛使用的需求,从最早的识别手写数字,邮编到现在的人脸识别。
在这里插入图片描述

(2)物体检测
目前物体检测的应用也相当广泛。比如通过城市与道路上的监控视频可以实时捕捉车辆,行人的动态;再比如自动驾驶汽车中也是通过车身上大量摄像头去捕捉周围的环境状况,从而做出相应合理的响应。
在这里插入图片描述

(3)风格迁移
这是近几年火了一段时间的风格迁移,虽然在社会价值上还只是娱乐性质,应用在拍照软件上较为多,但是却让人对神经网络的奇妙性大开眼界,相信业界的继续探索还会挖掘更多神奇与好玩的东西。
在这里插入图片描述
以上3类问题,在吴恩达的课程中都会一一讲解。

1.2 深度学习在图像上存在的问题

图像有一个很巨大的特点,就是特征为度尤为大。假设一张模糊的像素不高的图片为64643的大小,那么特征就有12288个,假设第一个隐藏层有1000个神经元,那么在全联接下参数的大小为12288*1000,要对图像做分类也好,物体检测也好,一层怎么够,那么于是参数的数目就会急剧增加,从而造成两个缺陷:内存与资源大量消耗+过拟合。
那么于是的于是,就需要我们的“卷积计算”隆重登场了。

2.边缘检测

入门卷积神经网络,先从边缘检测(edge detection)开始了解。

2.1 什么是边缘检测

假设有以下这样一张图,

在这里插入图片描述
要让计算机知道图里是什么,首先要进行垂直边缘检测,检测出图像中垂直的部位像这样:
在这里插入图片描述

然后要进行水平检测,检测水平的部位,像这样:

在这里插入图片描述

2.2 如何进行边缘检测

那么如何进行垂直检测呢,首先来看一个例子:
这是一个66的灰度图像(即黑白图像,只有一个颜色通道),因此可以表示成66*1的矩阵
在这里插入图片描述

为了检测图像中的垂直边缘,我们来构造一个3*3的小矩阵,这个东东很多论文里叫”卷积核”(kernel),吴恩达这边选择叫它”过滤器”(filter).
在这里插入图片描述

将图像和这个filter进行卷积计算,得到等号右边的4*4的矩阵
(在数学中表示卷积计算,但在python等代码中表示乘法,注意区分)

在这里插入图片描述
来,同学们,我们来做填数字的游戏
首先让filter与图片最左上角的33矩阵进行element-wise products:
即3
1+11+21+00+50+70+1-1+8*-1+2*-1 = -5,于是等号右边的4*4矩阵的第一行第一列的元素就填上-5.

在这里插入图片描述
然后将蓝色方形区域在图片上往右移动一格,覆盖住图片上新的33矩阵,再进行相似的计算,得到44矩阵中第一行第2列的元素为-4
在这里插入图片描述

接下来这个小蓝区域会一直继续往右移动,每次只移动一格,直到移动到边界为止,接着会往下移动一格,从左往右继续移动和计算剩下的元素。
在这里插入图片描述

直到等号右边的矩阵全部填写完成

在这里插入图片描述
好了,同学们,填数字游戏到此结束,每个人奖励一颗小红花,下课。
额,等等,这就是垂直边缘检测了?哪里垂直了,为什么说这是垂直边缘检测呢?
上面的例子只是为了告诉大家卷积计算的过程,下面来讲一个利用卷积计算,被检测到垂直边缘的例子。

又是一个6*6的图像,数字越大说明越白,数字为0说明是灰色的

在这里插入图片描述
表示成图像就像这样,是不是有一个超级明显的垂直边缘呢:
在这里插入图片描述

现在,仍然使用一个3*3的filter:

在这里插入图片描述
这个filter表示成图像如下,即1位白色,0位灰色,-1为黑色的三个颜色段:
在这里插入图片描述

接着让66的图像与33的filter做卷积计算,得到以下矩阵
在这里插入图片描述

神奇的是,进过卷积计算后得到的4*4矩阵,中间两列为30,两边为0,对应的的图像应该是:c

在这里插入图片描述
将卷积计算后的图像与原来的图像进行比较,发现原来的垂直线条的地方变成了一块白色区域,也就是说通过计算,我们检测到了原始图像的垂直线条,即计算后的白色线条,当然,这个白色线条有点粗,那是因为原始图像本身太小,放在正常的大图里(比如1000*1000),垂直边缘将被很好得检测出来。

在这里插入图片描述

2.3 垂直检测中的明暗过度

上小节中&

  • 0
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值