各种卷积的流程和优缺点

一.常规卷积

0

假设5x5x3的输入,如果想要得到3x3x4的feature map,那么卷积核的shape为3x3x3x4。

卷积层的参数数量可以用如下公式来计算 (即:卷积核W x 卷积核H x 输入通道数 x 输出通道数):

参数量 = 3 × 3 × 3 × 4 = 108

计算量 = 3*3*(5-2)*(5-2)*3*4=972

(即:卷积核W x 卷积核H x (图片W-卷积核W+1) x (图片H-卷积核H+1) x 输入通道数 x 输出通道数

二. 深度可分离卷积(Depthwise separable convolution)

(1)卷积过程

      深度可分离卷积主要分为两个过程,分别为逐通道卷积(Depthwise Convolution)和逐点卷积(Pointwise Convolution)。

 1.逐通道卷积(Depthwise Convolution)

  • 0

每个卷积核只卷对应通道,

参数量 = 3 × 3 × 3  = 27

计算量=3x3x(5-2)x(5-2)x3=243(即:卷积核W x 卷积核H x (图片W-卷积核W+1) x (图片H-卷积核H+1) x 输入通道数

2.逐点卷积(Pointwise Convolution)

Pointwise Convolution的运算与常规卷积运算非常相似,只是它的卷积核的尺寸为 1×1×M,M为上一层的通道数。

0

 参数量 = 1 × 1 × 3 × 4 = 12

计算量 = 1 × 1 × 3 × 3 × 3 × 4 = 108

(2)优缺点

   深度可分离卷积的优点是可大幅度减少卷积的参数。因此对于规模较小的模型,如果将2D卷积替换为深度可分离卷积,其模型大小可能会显著降低,模型的能力可能会变得不太理想,因此得到的模型可能是次优的。但如果使用得当,深度可分离卷积能在不牺牲模型性能的前提下显著提高效率。由于内存带宽和数据IO的限制,深度可分离卷积在GPU上的速度并不快,其主要原因是内存访问量很高。

 三. 可变形卷积(deformable convolution,DConv)

(1)卷积过程

可变形卷积的核心就是增加一个offset矩阵,实现无规律踩点卷积。

(a)是正常卷积,(b),(c),(d)是可变形卷积,箭头就是offset偏移量。

 如上图所示,偏差通过一个卷积层conv获得,输入特征图,输出偏差。生成通道维度是2N,其中的2分别对应X和Y这2个2D偏移,N是通道数。两个卷积核通过双线性插值后向传播算法同时学习。相当于比正常的卷积多输出了偏移特征。

(2)优缺点

 效果更好,支持了任意形状。特别是对于不规则和旋转目标的检测。

缺点是增加了计算量。卷积核一旦很大,那么整个算法会消耗掉非常大的空间,所以不建议在大卷积核中使用。

可以用分组思想降低计算量。

四. 分组卷积

(1)卷积过程

 分组卷积是将过滤器进行分组,上图为分为两组的形式,各自卷一半。组合成最后特征图。如果分两组,分组卷积的计算量会减小一般。

计算量 = 3*3*(5-2)*(5-2)*3/2*2=972

即:卷积核W x 卷积核H x (图片W-卷积核W+1) x (图片H-卷积核H+1) x 输入通道数/分组数 x 输出通道数/分组数 x 组数

(2)优缺点

优点.:分组卷积的参数量是正常卷积的1/N; 分组卷积可以看成是正常卷积的稀疏结构,可以视为一种正则,有防止过拟合的作用;过滤器分组似乎会将学习到的过滤器结构性地组织成两个不同的分组(AlexNet作者)。

缺点:数据信息只存在本组里面。通道之间的信息没有交互,存在信息的屏蔽和阻塞,不流通。

五. 空洞卷积(Dilated Convolution)

(1)卷积过程

image

 空洞卷积有一个参数可以设置dilation rate,具体含义就是在卷积核中相邻两个值内填充dilation rate-1个0。如图所示,3x3的卷积感受野变成了5x5。

(2)优缺点

优点:1.扩大感受野。但需要明确一点,池化也可以扩大感受野,但空间分辨率降低了,相比之下,空洞卷积可以在扩大感受野的同时不丢失分辨率,且保持像素的相对空间位置不变。简单而言,空洞卷积可以同时控制感受野和分辨率。2. 获取多尺度上下文信息。当多个带有不同dilation rate的空洞卷积核叠加时,不同的感受野会带来多尺度信息,这对于分割任务是非常重要的。3.可以降低计算量,不需要引入额外的参数。

缺点:1.网格效应:仅仅多次叠加 dilation rate 相同的相同尺寸卷积核,会导致kernel 不连续,进而导致不是所有的像素都用来计算了,因此这会损失信息的连续性。2.远距离特征可能不相关:空洞卷积卷的不是相邻像素,不相邻像素对小目标可能并不是同一物体。如果光采用大的扩张率的卷积可能只对一些大物体分割有效果,那么对小目标来说就不太友好了。因此设计好空洞卷积层的关键在于如何同时处理不同大小物体的关系。

  • 12
    点赞
  • 85
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: Faster RCNN 和 YOLO 的优缺点如下: Faster RCNN: 优点: 1. 准确性高:由于使用了RPN(区域提议网络)来生成候选区域,再通过RoI(感兴趣区域)池化来提取特征,因此Faster RCNN的准确性比较高。 2. 处理速度快:使用预训练的卷积神经网络(如VGG16、ResNet等)加速了训练和测试过程。 缺点: 1. 时间复杂度高:Faster RCNN的算法流程比较复杂,训练和推理时间比较长。 2. 实际应用困难:Faster RCNN的实际应用不够方便,需要一定的研究门槛。 YOLO: 优点: 1. 速度快:YOLO使用单个卷积网络,在实际应用中速度比较快。 2. 易于实际应用:YOLO简洁易懂,实际应用比较方便。 缺点: 1. 准确性较低:YOLO的准确性不如Faster RCNN,特别是在处理小物体时。 2. 无法识别复杂的场景:YOLO的单一卷积网络模型不能很好地处理复杂的场景。 ### 回答2: Faster R-CNN和YOLO是目标检测领域中常用的两种深度学习模型,它们分别采用了不同的架构和方法。 首先,Faster R-CNN是一种基于区域提议的目标检测模型,其优点包括:1)准确性较高,Faster R-CNN采用了两阶段的检测框架,首先使用Region Proposal Network(RPN)生成候选区域,然后再用分类器和回归器对候选区域进行分类和精细定位,有效提高了目标检测的准确率;2)鲁棒性较好,RPN能够检测不同大小、比例的目标,且在目标遮挡或视角变化情况下仍能保持较高的检测准确率;3)泛化能力强,Faster R-CNN可适用于多样化的目标检测任务。 缺点方面,Faster R-CNN也存在一些问题,例如:1)速度较慢,RPN生成候选区域的速度较慢,导致模型检测速度较慢;2)训练困难,需要训练两个网络,且需要大量标注数据;3)对小目标检测不敏感,RPN生成的候选区域通常较大,在小目标检测时容易漏检。 其次,YOLO是一种基于单个神经网络的目标检测模型,其优点包括:1)速度较快,YOLO将目标检测与区域生成合并到一个网络中,检测速度较快,适用于实时目标检测场景;2)对小目标、密集目标检测敏感,YOLO使用网格单元化方法,对密集小目标检测敏感;3)训练简单,YOLO不需要生成候选区域,只需要标注目标和背景,少量标注数据即可训练。 缺点方面,YOLO也存在一些问题,例如:1)准确率相对较低,依赖于单一尺度上的特征,对复杂场景的目标检测有一定的局限性;2)抗遮挡性较弱,对目标遮挡较多的情况下容易漏检;3)对目标比例不敏感,难以检测大小不一的目标。 综上所述,Faster R-CNN和YOLO各有优缺点,可根据具体应用场景进行选择。如果要求检测准确性较高,可以选择Faster R-CNN;如果要求实时检测,并且对于小目标、密集目标要求较高,可以选择YOLO。 ### 回答3: Faster R-CNN和YOLO都是目标检测领域中常见的算法,两种算法各有优缺点。 首先,Faster R-CNN是基于深度学习的目标检测算法,其主要优点在于精度高。Faster R-CNN利用了Region Proposal Network (RPN)来生成候选区域,再使用RoI Pooling和全连接层对候选区域进行裁剪和分类。Faster R-CNN采用了两个网络结构,一个是RPN,用于生成候选区域;另一个是Fast R-CNN,用于分类和检测。由于使用两个网络,Faster R-CNN具有更好的精度,同时也适用于目标尺寸不同的图像。 其次,YOLO(You Only Look Once)是一种基于单个神经网络的目标检测算法,其主要优点在于速度快。YOLO将整个图像分成S × S个网格,每个网格预测B个边界框和类别概率。与Faster R-CNN不同的是,YOLO只需要一次前向传递就可以同时完成边界框定位和类别识别任务,因此速度更快。此外,YOLO还可以实时处理视频流。 但是,两种算法也存在各自的缺点。Faster R-CNN虽然精度高,但速度较慢,处理大量图像时效率较低。而YOLO处理目标较小的图像时性能差,面对类别数量较多的问题时可能发生识别混淆。此外,YOLO对于物体尺寸变化较大,比如近距离拍摄和远距离拍摄同一个物体,容易发生尺度不变性问题,会导致物体的检测效果不够精确。 总之,Faster R-CNN和YOLO各有长处和短处,在应用到不同场景下时需要根据具体情况进行选择,以达到最好的检测效果。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值