[机器学习]Lecture 3(Preparation)：Convolutional Neural Networks, CNN

zzz_qing

于 2023-04-10 23:46:32 发布

阅读量94

点赞数

文章标签： cnn 深度学习计算机视觉

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zzz_qing/article/details/130070080

版权

文章探讨了CNN在图像识别中的应用，强调了卷积层和池化层的重要性。通过参数共享减少过拟合风险，卷积层用于检测图像中的模式，而池化层则用于减小特征尺寸。文章提到了CNN的基本架构，包括输入层、卷积层、池化层和全连接层，并指出数据增强对于处理尺度和旋转不变性的重要性。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

目录

Convolutional Neural Network (CNN)

Image Classification

Neuron Version Story

Another way to introduce CNN——Filter Version Story

下面探讨network的架构设计。通过CNN这个例子，来说明Network架构的设计有什么样的想法，说明为什么设计Network的架构可以让我们的Network结果做的更好。

Convolutional Neural Network (CNN)

——专门被用在影像上

Image Classification

下面是一个图片分类的例子。对machine来说，一张图片是一个三维的Tensor，把这个三维的Tensor拉直成一个向量后就可以丢到一个Network里面。下面的小猫图像对应的Tensor，展开后就是一个长度为100*100*3的向量，假如说把这个向量作为Fully Connect Network的输入，然后Fully Connect Network第一层的Neuron数目有1000个的话，那么第一层总共有3*10^7个权重参数。

随着参数的增加，模型的弹性和能力会增加，但overfitting的风险也会增加。所以在做影像辨识的时候，要避免使用过多的参数。考虑到影像辨识问题本身的特性，我们并不一定需要Fully Connected。

Neuron Version Story

对影像辨识问题的一些Obervation:

Obervation-1.侦测图片里面一些重要的patterns，这些pattern代表了某种物件（例如鸟嘴、眼睛和爪子）。这些pattern会比图片小很多，所以每个neuron不需要去看整张图片，只需要能看到一些重要的patterns。

针对以上观察，我们可以对Fully Connected Network做一些简化。不需要让一个Neuron看完整的图片，只需要让它看图片的一小部分就够了(receptive field)。

Obervation-2. The same patterns appear in different regions. 同样的pattern可能会出现在图片的不同区域里面。

如果每一个receptive field都对某一个pattern进行侦测，会造成参数过多。简化方式：让不同receptive field的Neuron共享参数——Parameter Sharing。

对以上的两点讨论做一个conlusion——Benefit of Convolutional Layer：

Another way to introduce CNN——Filter Version Story

李老师在这里用经典方式介绍了一下CNN，以下是关于b站CNN入门的一个讲解视频的笔记，和老师第二种讲解方式类似。

卷积神经网络整体架构：输入层——>卷积层CONV(提取特征，后面会跟一个激活函数，通常是RELU)——>池化层POOL(压缩特征)——>全连接层FC(输入层和隐层连在一起就是全连接操作)

卷积完后得到特征图，filter的数量决定了特征图的数量

卷积层涉及参数：滑动窗口步长，卷积核尺寸，边缘填充，卷积核个数(卷积参数共享：不同区域使用相同卷积核)

池化层：现阶段基本使用最大池化MAX POOLING

卷积神经网络的层数：看卷积层和全连接层的层数

以上笔记对应的b站课程链接：https://www.bilibili.com/video/BV1zF411V7xu/?spm_id_from=333.337.search-card.all.click&vd_source=534308c33da1180628ab8ca3f3f245c3

上面用两种方式讲解了Convolutional Layer，如下图：

Pooling

接上上面对影像辨识问题的一些Obervation的讨论。

Obervation-3. Subsampling the pixels will not change the object. Pooling本身没有参数，它里面没有weight，没有需要Learn的东西，不是一个layer。

The whole CNN

To learn more: CNN is not invariant to scaling and rotation (we need data augmentation).

博客等级

码龄6年

44
原创

2
点赞

14
收藏

10
粉丝

关注

私信

热门文章

分类专栏

论文精读 2篇

最新评论

Overcoming catastrophic forgetting in neural networks
xuebing55555: 请问有完整实现代码吗？
Lecture 15：元学习Meta Learning2
CSDN-Ada助手: 非常棒的博客！学习元学习是非常有趣和有用的！我们希望看到更多关于此主题的内容。我们建议您写一篇有关如何使用元学习来优化深度学习模型的博客。谢谢你的分享！ 2023年博客之星「城市赛道」年中评选已开启（https://activity.csdn.net/creatActivity?id=10470&utm_source=blog_comment_city ），博主的原力值在所在城市已经名列前茅，持续创作就有机会成为所在城市的 TOP1 博主（https://bbs.csdn.net/forums/blogstar2023?typeId=3152981&utm_source=blog_comment_city），更有丰厚奖品等你来拿~。
Lecture 15：元学习Meta Learning2
CSDN-Ada助手: 恭喜你，获得了 2023 博客之星评选的入围资格，请看这个帖子（https://bbs.csdn.net/topics/615663682?utm_source=blogger_star_comment）。请在这里提供反馈： https://blogdev.blog.csdn.net/article/details/129986459?utm_source=blogger_star_comment。
The first GAN——Generative Adversarial Nets
CSDN-Ada助手: 恭喜你这篇博客进入【CSDN每天值得看】榜单，全部的排名请看 https://bbs.csdn.net/topics/614789723。
[机器学习]Lecture 1：Regression，Pokemon classification，Logistic Regression
CSDN-Ada助手: 非常感谢您分享这篇博客。恭喜您能够坚持创作，继续保持哦！同时，我希望您能够在未来的博客中，更深入地探讨机器学习的其他方面，例如深度学习和神经网络等等。期待您的下一篇作品，谢谢！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=ada，我们会奖励持续创作和学习的博主，请看：https://bbs.csdn.net/forums/csdnnews?typeId=116148

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。