递归门控卷积HorNet(gn_conv)阅读笔记

HorNet: Efficient High-Order Spatial Interactions with Recursive Gated Convolutions ECCV2022
程序
视觉 Transformers 的最新进展在基于点积 self-attention 的新空间建模机制驱动的各种任务中取得了巨大成功。在本文中,我们展示了视觉 Transformer 背后的关键要素,即输入自适应、远程和高阶空间交互,也可以通过基于卷积的框架有效实现。我们提出了递归门控卷积(gnConv),它通过门控卷积和递归设计执行高阶空间交互。新操作具有高度的灵活性和可定制性,它兼容各种卷积变体,并将自注意力中的二阶交互扩​​展到任意阶,而不会引入大量额外的计算。 gnConv 可以作为一个即插即用的模块来改进各种视觉 Transformer 和基于卷积的模型。基于该操作,我们构建了一个新的通用视觉骨干家族,名为 HorNet。在 ImageNet 分类、​​COCO 对象检测和 ADE20K 语义分割方面的大量实验表明,在整体架构和训练配置相似的情况下,HorNet 的性能明显优于 Swin Transformers 和 ConvNeXt。 HorNet 还显示出对更多训练数据和更大模型大小的良好可扩展性。除了在视觉编码器中的有效性外,我们还展示了 gnConv 可以应用于特定任务的解码器,并以更少的计算量持续提高密集预测性能。我们的结果表明,gnConv 可以成为一个新的视觉建模基础模块,它有效地结合了视觉 Transformer 和 CNN 的优点。代码可在 https://github.com/raoyongming/HorNet 获得。
在这里插入图片描述

我们的主要思想的插图。我们展示了执行不同交互顺序的代表性空间建模操作。在本文中,我们专注于研究特征(红色)与其相邻区域(浅灰色​​)之间的显式空间交互。 (a) 标准卷积运算没有明确考虑空间交互。 (b) 动态卷积 [27, 4] 和 SE [25] 引入了动态权重,以通过额外的空间交互来提高卷积的建模能力。 © 自注意力操作 [52] 通过两个连续的矩阵乘法执行二阶空间交互。 (d) gnConv 使用具有门控卷积和递归设计的高效实现来实现任意阶空间交互。
Transformer[41] 对采用视觉 Transformer 的元架构来改进 CNN 进行了深入研究,并提出使用大型 7×7 内核来构建现代 CNN。 [44] 和 [14] 分别建议使用更大的

  • 5
    点赞
  • 50
    收藏
    觉得还不错? 一键收藏
  • 4
    评论
YOLOv7引入了递归门控卷积gnConv)来改善目标检测效果。主干特征提取网络为CNN网络,而CNN具有平移不变性和局部性,但缺乏全局建模长距离建模的能力。为了解决这个问题,YOLOv7引入了自然语言处理领域的框架Transformer,并将其与CNN网络相结合形成了CNN Transformer架构。 通过引入递归门控卷积gnConv),YOLOv7实现了高阶空间交互。gnConv是一种门控卷积递归设计,它具有高度的灵活性和可定制性,并能够将自注意力中的二阶交互扩展到任意阶,而不会引入大量额外的计算。这使得gnConv可以作为一个即插即用的模块来改进各种视觉Transformer和基于卷积的模型。 通过引入递归门控卷积,YOLOv7能够充分利用CNN和Transformer两者的优点,提高目标检测的效果。特别是对于小目标以及密集预测任务,经过实验表明,YOLOv7引入递归门控卷积能够产生一定的提升效果。同时,这种改进方法不仅适用于YOLOv7,也可以应用于其他的YOLO网络以及目标检测网络,如YOLOv6、v4、v3、Faster RCNN、SSD等。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* *2* *3* [YOLOv7改进之二十二:涨点神器——引入递归门控卷积gnConv)](https://blog.csdn.net/m0_70388905/article/details/126142505)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_1"}}] [.reference_item style="max-width: 100%"] [ .reference_list ]
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值