感受野,以及为什么神经网络可以分清猫是猫,狗是狗的直观理解

本文探讨了卷积神经网络的工作原理,强调了感受野在特征提取中的作用。卷积核作为特征提取器,通过不断优化参数以找到最佳特征表示。网络深度增加能提升特征提取能力,但也会面临梯度消失等问题,ResNet等结构提供了解决方案。理解感受野有助于我们更好地理解神经网络如何学习和表征信息。
摘要由CSDN通过智能技术生成

感受野这篇文章说的挺详细的感受野
读完这篇文章,个人感觉算是对神经网络为什么能够学习到我们想要获得的信息有了更具体的一点认知吧。下面用自己的话来说一下。
深度学习中,所用的卷积神经网络,有很多卷积层,每个卷积层都用到了卷积核,个人的理解,卷积核就是一个特征提取器,输入图像(以图像为例)通过卷积核的卷积操作再经池化后,会得到一个所含信息更少的特征层。而神经网络之所以能够最终获得令人满意的学习效果,核心机制就是通过不断地更新卷积核的参数,也就是不断地优化这些许许多多的特征提取器,最终在目前的能力之内,找到一组最优的特征提取器,使得一层一层提取出来的特征信息能够最大程度的表征我们训练集中给定的label,达到网络的预测效果与训练集效果相接近。当然这中间会涉及到过拟合欠拟合等等神经网络中的一系列问题,我们可以增加相应的措施来改善。而提取出来的特征中,我们可能很难用比如猫的眼睛大,狗的眼睛小这种日常的逻辑去理解为什么会把它们提取出来,但是这些我们无法直观理解的特征恰恰能够达到我们想要的学习效果,原因就在于我们更新特征提取器是以数学上的最优化(loss最小)为准则而不是以简单、不严谨也有限的日常逻辑为准则。而且一般来说,网络越深,效果越好,目前我的理解是,越深的网络拥有更多层的卷积提取器,能够充分获得原图像中的信息并且进行充分的特征筛选提取。这里又会遇到一些问题,比如梯度消失,梯度爆炸现象,最近读到的ResNet网络对这个问题有比较好的解决效果。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值