李宏毅机器学习——卷积神经网络

Virginica

于 2021-10-23 23:10:03 发布

阅读量274

点赞数

文章标签：机器学习 cnn 人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Virginica/article/details/120927920

版权

本文详细介绍了卷积神经网络（CNN）在图像识别中的应用，通过receptive field和参数共享概念简化计算。讲解了CNN的原理，如局部感知和参数共享的作用，以及多层卷积和池化操作如何提高识别能力。重点提到了在AlphaGo中CNN的应用实例。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

Lecture 6 convolutional neural network（卷积神经网络）

Image identification

输入比如100*100的图像，三层，每层上数字代表深度，按100*100*3输入，如果输出维度是1000，那么如果全部考虑需要3*10^7，如何简化？

convolution：原理：只根据图片的一小部分就能识别，比如鸟嘴，那么：选一个小区域（receptive field）只关注一个小范围有什么，receptive field可以有大有小，可以重叠，但是通常typical setting：{all channel、kernel size较小，=3、一个field对应一组神经元，移动距离stride，}

问题：比如鸟嘴在不同位置，那么每一个field都有对应甄别鸟嘴的神经元，那么可以共享→2

2. parameter sharing：神经元里weight都是一样的，但是输入不同

常见的共享方法：

总结：receptive field + parameter sharing=CNN

fully connected 可能会有overfitting问题，弹性高， Receptive field会使弹性变小，加入parameter sharing会更小，bias变大，但是CNN对于特定的问题（图像识别）很好

第二个方式解释 CNN

从filter的角度，假设filter里面参数已知（实际上需要梯度下降找到）把filter分别对应到图像里，一步一步移动

Multiple convolution layers

第一次过滤后得到新的“image”，如果64个filter就有64层，可以进行多次convolution

Net work 够深，就可以甄别足够大的范围（上图）

3. Pooling-把图片变小，去边（里面没有参数，没有要learn的东西）

Filter里面得到的数组2*2一组，选取最大的做代表（max pooling）

应用：下围棋AlphaGo

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。