YOLOv5魔改:WC3!助力YOLOv5准确率提高

18 篇文章 0 订阅 ¥199.90 ¥299.90
博客介绍了将Wave-MLP架构应用于YOLOv5以提高目标检测的准确性的方法。Wave-MLP通过考虑振幅和相位信息的通道混合MLP和相位感知token混合块动态聚合标记,从而在视觉任务上表现出优越性能。文章详细阐述了网络结构和实验结果,并提供了将WC3模块整合到YOLOv5的代码和yaml配置文件。
摘要由CSDN通过智能技术生成

目录

一、理论部分

网络结构

实验结果

二、WC3

代码

 应用到yolov5

yaml配置文件


一、理论部分

在计算机视觉领域,最近的研究表明,以全连接层堆叠为主的纯MLP架构可以达到与CNN和transformer相媲美的性能。视觉MLP的输入图像通常被分割成多个标记(patch),而现有的MLP模型直接将它们以固定的权重进行聚合,忽略了来自不同图像的标记的不同语义信息。为了动态聚合标记,我们建议将每个标记表示为具有振幅和相位两部分的波函数。振幅是原始特征,相位项是根据输入图像的语义内容而变化的复值。引入相位项可以动态调节MLP中令牌与定权之间的关系。基于类波标记表示,我们建立了一种新的用于视觉任务的WaveMLP架构。大量的实验表明,在图像分类、目标检测和语义分割等各种视觉任务上,所提出的Wave-MLP架构优于最先进的MLP架构。

网络结构

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

这糖有点苦

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值