关于卷积填充和步长等计算

4.1卷积神经网络

 

1.4Padding

  • 一张6∗6大小的图片,使用3∗3的卷积核设定步长为1,经过卷积操作后得到一个4∗4的图像。

    特征图大小公式

  • 设定原始图像大小为n∗n,卷积核大小为f∗f,则经过卷积操作后特征图大小为(n−f+1)∗(n−f+1)

    不使用Padding的缺点

  • 经过卷积操作后图像会缩小.
  • 如果你注意角落边的像素,则此像素点只会被卷积核触碰一次。即只会在第一次卷积操作时被卷积核扫描.这意味着会丢失图像边缘的很多信息.
  • 但是对于原始图像中心的像素点,在每次卷积操作时都会被扫描。卷积核的感受野会扫描此位置多次.

    使用Padding进行维度的填充

  • 为了使每次卷积操作后大小不会丢失,使用0填充在原始图像的外围。
  • 假设p作为填充在原始图像外围的Padding大小,则经过卷积操作后的特征图大小为(n+2p−f+1)∗(n+2p−f+1)

    Padding填充大小公式

  • 如果需要使经过卷积后的特征图大小保持不变,则填充大小需要满足公式

    n+2p−f+1=n

    p=(f−1)/2

  • 所以只要f即卷积核的边长是奇数,则能保证输出的特征图大小与原图像大小相等。

    通常使用奇数维度的过滤器大小

  • 通常使用奇数维度的过滤器大小,这样可以使SAME Padding后的图像有自然的填充而不是出现小数维度。
  • 奇数维度的卷积核具有中心点,便于指出过滤器的位置。


1.5卷积步长

示例

设置通道数、卷积核大小、步长、扩张率和输出填充的具体数值是根据具体的网络架构和任务需求来确定的。以下是一些常见的设置方法和考虑因素: 1. 通道数:通道数的选择通常需要根据任务的复杂性和数据的特点来决定。较大的通道数可以提供更多的特征表达能力,但也会增加计算和内存开销。可以通过实验和调优来选择合适的通道数。 2. 卷积核大小:卷积核大小决定了神经网络能够捕捉到的特征的尺度。较小的卷积核能够捕捉到更细节的特征,而较大的卷积核则更适合捕捉更宏观的特征。常见的卷积核大小包括3x3、5x5和7x7等。 3. 步长步长指定了卷积核在输入上移动的距离。较大的步长可以减小输出特征图的尺寸,同时减少计算量,但可能会导致信息丢失。常见的步长包括1、2和3等。 4. 扩张率:扩张率指定了卷积核内部元素之间的间隔大小。通过增加扩张率,可以扩大卷积核感受野的范围,从而更好地捕捉局部和全局特征。常见的扩张率包括1、2和3等。 5. 输出填充:输出填充是在卷积操作后对输出特征图进行填充的操作。填充可以在特征图的边界上添加额外的像素,以保持特征图的尺寸。输出填充通常用于调整特征图的尺寸,以便与输入或其他层的特征图进行连接或组合。 需要根据具体情况和需求进行合理的设置,并通过实验和调优来选择最佳的参数配置。同时,还可以参考已有的网络架构和研究论文中的设置,以获取更好的性能和效果。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值