李宏毅机器学习(9)

CNN

Why CNN for Image

FNN 处理图片的缺点
  • 需要很多的参数假设有一张尺寸100×100的图片(尺寸已经算很小了),那输入层就有100×100×3=30K个像素,假设第一个隐藏层有1K个神经元(一个神经元包含30K个参数),这就已经需要30M个参数了……
  • 该架构中每个神经元就是一个分类器,这是没必要的第一个隐藏层作为最基础的pattern分类器(比如判断有无绿色、边缘等),第二个隐藏层基于第一个隐藏层继续做pattern分类(比如木头、肉类),以此类推……

在这里插入图片描述

图片的一些性质
  1. Some patterns are much smaller than the whole image.
    在这里插入图片描述
  2. The same patterns appear in different regions.
    在这里插入图片描述
    3.Subsampling the pixels will not change the object.
    在这里插入图片描述

CNN架构

CNN可以总结为:多次的Convolution和Max Pooling,然后再用一个Flatten,将结果放入FNN中。、

Convolution

假设Image是一个 6 × 6 6 \times 6 6×6的矩阵,值由输入获得。定义Filter(卷积核)是对应的一个神经元。在这里,一个Filter是一个 3 × 3 3 \times 3 3×3的矩阵,值由学习得到。
在这里插入图片描述
随后,将Filter和Image的每个 3 × 3 3 \times 3 3×3的子矩阵做内积,得到的值又构成了一个 4 × 4 4 \times 4 4×4矩阵,称为特征图(Feature Map)。
在这里插入图片描述
同样的,在处理彩色图片的时候,一个颜色有三个数值表示,就相当于Image是一个三维矩阵,则Filter也要是三维的。
在这里插入图片描述

Convolution VS Fully Connected

Convolution 无疑比Fully Connected更有优势,主要有两个优点。

  1. Convolution 模型的参数更少
    在这里插入图片描述
  2. Convolution 可以在不同区域做卷积时共享参数
    在这里插入图片描述
Max Pooling

在Convolution 之后,对得到的矩阵(如本例中的 4 × 4 4 \times 4 4×4的矩阵)进行划分,对每个区域取一个最大值,再次组成一个矩阵。
在这里插入图片描述
在这里插入图片描述

Flatten

经过一系列的Convolution和Max Pooling,将得到的特征图展开排列,作为FNN的输入,最后输出结果。
在这里插入图片描述

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值