计算机视觉网络基础知识(1)

卷积计算

        卷积是数学分析中的一种积分变换的方法,在图像处理中采用的是卷积的离散形式。互相关运算作为卷积的定义,大致过程如下:

        输出结果的计算过程就是输入区域取与核相同大小的a区域,与核进行对于位置数据相乘,最后再将所以结果相加获得输出结果中的一个数据,然后再将a区域移动移动方向对应输出区域的位置,按从左往右、从上往下的顺序,依次在输入数组上滑动。(若是存在偏置,最终结果还应该增加偏置值)

        卷积核也被叫做滤波器,实现信号的滤波和特征提取。假设卷积核的高和宽分别为𝑘ℎ和𝑘𝑤,则将称为𝑘ℎ×𝑘𝑤卷积,比如3×5卷积,就是指卷积核的高为3, 宽为5。


填充

        经过一次卷积后,图像尺寸变小,具体变化如下图所示:

        如果经过多次卷积,输出图片尺寸会不断减小,边界和角落像素丢失越来越多,导致模型训练效果不佳。且当卷积核的高度和宽度不同,通过填充使输入和输出具有相同的宽和高。 

        具体做法就是在原图像周围增加一圈或者多圈数值0,增加初始H和W,这样卷积并不会改变卷积前后图像大小,保留边缘信息。卷积核大小通常使用1,3,5,7这样的奇数。


步幅

        上文提到过,卷积计算就是卷积核在输入图像中移动计算值,当宽和高方向的步幅分别为𝑠ℎ和𝑠𝑤时,输出特征图尺寸的计算公式是:

        设输入图片尺寸是𝐻×𝑊=100×100,卷积核大小𝑘ℎ×𝑘𝑤=3×3,填充𝑝ℎ=𝑝𝑤=1,步幅为𝑠ℎ=𝑠𝑤=2,则输出特征图的尺寸为: 


感受野

         感受野可以用来描述神经网络中每个神经元接收信息的范围和影响。输出特征图上每个点的数值,是由输入图片上大小为𝑘ℎ×𝑘𝑤的区域的元素与卷积核每个元素相乘再相加得到的,所以输入图像上𝑘ℎ×𝑘𝑤区域内每个元素数值的改变,都会影响输出点的像素值。我们将这个区域叫做输出特征图上对应点的感受野。

       如上图所示,当卷积核大小为4*3,且步幅为2时,感受野的大小就为9*7.若是多层卷积,某一个像素点感受野也会越来越大,即输出特征图中的一个像素点将会包含更多的图像语义信息。同样的,通过池化层的操作,神经元感受野的大小会相应增加。

        在卷积神经网络(CNN)中,感受野可以通过卷积层和池化层的设置来控制。卷积层使用卷积核对输入图像进行卷积操作,从而提取特征。每个卷积核对应一个神经元,该神经元只对输入图像中与卷积核大小相同的区域进行感知,并生成相应的特征图。通过不同层次的卷积操作,上层神经元的感受野会逐渐增大。

        因此,在设计神经网络时,需要根据任务的需求和输入数据的特点来选择合适的感受野大小。通常会通过多层的卷积和池化操作来逐渐增加感受野的大小,以获得更好的特征表示能力。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值