卷积神经网络（CNN）——hungyi Lee

最新推荐文章于 2024-06-03 10:03:27 发布

nanyidev

最新推荐文章于 2024-06-03 10:03:27 发布

阅读量767

点赞数 3

分类专栏： 2022 文章标签：机器学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/ji_meng/article/details/123863922

版权

2022 专栏收录该内容

26 篇文章 13 订阅

订阅专栏

文章目录

卷积层（Convolutional Layer）
最大池化层（Max Pooling）
完整的CNN

之前讲的都是线性回归和简单分类，这次进入深度学习最经典也是最有活力的一部分——卷积神经网络之图像分类。

卷积层（Convolutional Layer）

通常图像也可以被看成一个向量，相当于把像素拉直，如果是彩色图片，就是三个长向量，也就是说一个彩色图片就是一个三维的tensor：(width，height，channel）

那按照之前的思路，应该是用全连接网络（fully connected network）,但是就图像来说，即使是一张100x100的彩色图片，输入的维度就已经是100x100x3，可以说数据量非常大，而且这样还容易造成过拟合。
所以，CNN就出现了——探索图像独特的性质；
不需要让神经网络看完整的一张图像，只需要关心一些重要的特点（人眼辩视物体也一样）——从感受野（receptive field）角度来分析，每个receptive field只关心自己的neural输出什么，如下图，一个3x3x3的field是27维的向量，输入到神经网络，不同的感受野可以重叠。

经典的做法如下图：

每个感受野有一组神经元，并且可以参数共享：

所以，综合整个过程，可以得到FC与CNN的关系，可以说CNN是专门为图像所设计的（CNN的概念更小）

另一种CNN的解释（更常见）：
卷积层与卷积核:

比较两个解释：其实是一样的，第一种解释里面的weight就是第二种里面卷积核的参数

最大池化层（Max Pooling）

对图片进行降采样，不会影响图片的辨识——池化
例如下图中，是4x4大小的图片，我们采用2x2的池化层：

得到以下结果：

完整的CNN

一般来说，对图像进行卷积网络操作时，要先经过卷积层，再经过池化层，依次重复几次，然后经过平滑层，最后送入全连接网络。

而我们熟知的VGG全程就是VERY DEEP CONVOLUTIONAL NETWORKS，网络堆叠的非常深，如下图所示：
在这里插入图片描述

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。