计算机视觉基础知识归纳(二) —感受野
感受野的重要意义
- 深度神经网络的基本概念之一
- 很大程度上决定了网络的性能
- 视觉应用(分类,检测,分割,等)都需要利用感受野进行理解
- 促使我们进行创新的源泉
CNN感受野的定义与性质
定义:深度神经网络中,每个神经元节点都对应输入图像的某个确定区域,仅在该区域的图像内容能够对相应的神经元的激活产生影响,那么这个区域就是神经元的感受野
性质:
- 越靠近感受野中心区域越重要
- 各向同性(距离感受野中心距离相等的位置,其重要性是一致的)
- 由中心向周围衰减的速度可以由网络结构控制
感受野如何计算
-
影响感受野的因素
能改变感受野的操作:卷积层,反卷积,池化层,残差连接,合并连接
不能改变感受野的操作:非线性层,正则化层(BN,GN)
-
感受野的计算 每一层根据卷积核与步长进行计算
-
感受野中心的计算 先计算左上角的位置,随后通过推导公式推算出其他位置的感受野中心位置
有效感受野
-
有效感受野的概念
1.感受野中的每个位置都对神经元激活产生影响,并不是所有的贡献都是一样的,我们把贡献大的 位置称之为有效感受野
2.有效感受野是神经网络内在的属性,当网络结构稳定,有效感受野的相关属性也就稳定了
3.感受野大小相等的情况下,网络结构不同,有效的感受野的特性就不同
-
有效感受野的计算 参考相应文献
-
有效感受野为什么重要
1.通过感受野我们可以知道神经网络关注的重点在哪里,找到问题的核心
2.指导任务(分类,检测,分割网络的设计)有多深
3.进一步探索网络的可解释
感受野如何影响分类网络
分类网络中Resnet是一个重要的里程碑
1.解决了深度网络反向更新的时候梯度消失的问题
2.增强了特征图的表征能力 融合了不同感受野尺度的特征图
分类网络的深度是便于有效感受野可以覆盖全图,这样子特征表达是最好的
所以往往图像中间的分类可以得到比较好的效果
这也是为什么分类中有一个trick,就是可以随机裁剪区域中的子图像来便于后续的处理
结论
- 结构类似的情况下,感受野越大,性能越好
- 感受野并不是完全决定性能,这个与有效感受野有关(提升结构的优越性,比单纯增加感受野更有效)