CNN基础

 转载自CNN基础_fun1024-CSDN博客

1. 计算机视觉

(Computer Vision)

一般的CV问题包括以下三类:

    1. 图像分类(Image Classification)
    2. 目标识别(Object detection)
    3. 神经风格转换(Neural Style Transfer)

使用传统神经网络处理机器视觉的一个主要问题是输入层维度很大。如果图片尺寸较大,例如一张1000x1000x3的图片,神经网络输入层的维度将达到3百万,使得网络权重W非常庞大。这样会造成两个后果,一是神经网络结构复杂,数据量相对不够,容易出现过拟合;二是所需内存、计算量较大。解决这一问题的方法就是使用卷积神经网络(CNN)

CNN做的事情其实是,来简化这个neural network的架构,我们根据自己的知识和对图像处理的理解,一开始就把某些实际上用不到的参数给过滤掉,我们一开始就想一些办法,不要用fully connected network,而是用比较少的参数,来做图像处理这件事情,所以CNN其实是比一般的DNN还要更简单的。
 

2. 卷积操作:以边缘检测举例

(Edge Detection)

最常检测的图片边缘有两类:一是垂直边缘(vertical edges),二是水平边缘(horizontal edges)。

 图片的边缘检测可以通过与相应滤波器进行卷积来实现。以垂直边缘检测为例,原始图片尺寸为6×6,滤波器filter尺寸为3×3,卷积后的图片尺寸为4×4,得到结果如下:

其中 * 表示卷积操作,上图只显示了卷积后的第一个值和最后一个值,其余值可自行计算。

以垂直边缘检测(vertical edges detection)为例,利用卷积可以检测到图像的垂直边缘:

3. 边缘检测补充

图像边缘有两种渐变方式,一种是由明变暗,另一种是由暗变明。以垂直边缘检测为例,下图展示了两种方式的区别。实际应用中,这两种渐变方式并不影响边缘检测结果,可以对输出图像取绝对值操作,得到同样的结果。

 下图展示一个水平边缘检测的例子:

 垂直边缘检测和水平边缘检测的滤波器算子如下所示:

 除了上面提到的这种简单的Vertical、Horizontal滤波器之外,还有其它常用的filters,例如Sobel filter和Scharr filter。这两种滤波器的特点是增加图片中心区域的权重。(下图展示的是垂直边缘检测算子,水平边缘检测算子只需将上图顺时针翻转90度即可。)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值