cloformer,可用于主干网络提取特征,融合低频和高频信息

某鱼多个模块打包https://m.tb.cn/h.g7kxzvI?tk=9WH33YU4JYc   可以直接使用。

本文提出了一种轻量级视觉变压器模型CloFormer,该模型可有效捕获高频局部信息和低频全局信息。主要创新包括:

  1. AttnConv模块:作者介绍了一个名为AttnConv(注意力卷积)的新模块,该模块将卷积的优点与共享权重以及自我注意力与内容感知权重的局部感知相结合。AttnConv 使用具有共享权重的深度卷积来聚合局部特征,然后使用非线性比普通自注意力更强的门控机制生成内容感知权重。这些内容感知权重用于增强由共享卷积权重提取的局部特征。

  2. 双分支架构:CloFormer 具有双分支结构 - 一个使用 AttnConv 捕获高频信息的本地分支,以及一个使用标准注意力和池化的全局分支来捕获低频全局信息。两个分支的输出被融合在一起,以组合局部和全局表示。

  3. 模型变体:本文介绍了三种模型变体 - CloFormer-XXS、CloFormer-XS 和 CloFormer-S,它们具有不同的模型大小,针对移动设备上的不同计算预算。

Yolov7主干网络提取特征的过程如下所示: 1. Yolov7主干网络通过提取多层特征进行多尺度特征融合。在neck部分,一共提取三个特征层,它们的尺寸分别为(80,80,512), (40,40,1024) 和(20, 20,1024)。 2. 首先,将(20, 20,1024)的特征图使用SPPCSPC结构进行特征提取,这个结构可以提高Yolov7的感受野,并被命名为P5。 3. 在Yolov7的主干特征提取网络中,主要包括ELAN和Transition block两个模块。 4. ELAN模块用来提取图像特征。 5. Transition block模块用来对特征图进行下采样。通常情况下,下采样可以通过一个卷积核大小为3×3、步长为2的卷积或者一个步长为2的MaxPooling层来实现。 6. 在Yolov7中,通过将下采样操作整合在一起来完成下采样工作。Transition block模块存在两个分支,左分支是一个步长为2的MaxPooling和一个1×1的卷积,右分支是一个1×1卷积和一个卷积核大小为3、步长为2的卷积,两个分支的输出会进行通道堆叠。 综上所述,Yolov7主干网络提取特征的过程包括了多尺度特征融合特征下采样的步骤。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* *2* *3* [目标检测算法Yolov7](https://blog.csdn.net/hello_dear_you/article/details/129646502)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 100%"] [ .reference_list ]
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

CV缝合怪

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值