YoloV8改进策略：基于分层注意力的FasterViT，让YoloV8实现性能的飞跃

AI智韵

已于 2023-12-24 16:07:37 修改

阅读量4.5k

点赞数 3

分类专栏： YoloV8最新改进手册——高阶篇文章标签： YOLO

于 2023-07-05 06:00:24 首次发布

不能复制，转发

本文链接：https://blog.csdn.net/m0_47867638/article/details/131546993

版权

YoloV8最新改进手册——高阶篇专栏收录该内容

该专栏为热销专栏榜第3名

151 篇文章 203 订阅 ¥199.00 ¥299.90

订阅专栏

文章目录

摘要
论文翻译
官方测试结果
改进一：将Bottleneck替换为ConvBlock
- 改进方法
- 测试结果
改进二：FasterViTLayer替换C2f模块
总结

摘要

这篇文章向大家展示如何使用FasterViT改进YoloV8，我尝试了几种方法，选出了三种效果比较好的方法推荐给大家。测试结果是在我自己标注的数据集上测得，模型选用yolov8l。代码和文章都会上传到百度网盘上，地址详见文章的最后！
在这里插入图片描述

论文翻译

摘要

论文链接：https://arxiv.org/pdf/2306.06189.pdf
本文设计了一种新的混合CNN-ViT神经网络族，名为FasterViT，专注于计算机视觉(CV)应用的高图像吞吐量。FasterViT结合了cnn的快速局部表示学习和ViT的全局建模特性的优点。新提出的分层注意力(HAT)方法将具有二次复杂度的全局自注意力分解为具有减少计算成本的多级注意力。我们受益于基于窗口的高效自我关注。每个窗口都可以访问参与局部和全局表示学习的专用载体Token。在高层次上，全局的自我关注使高效的跨窗口通信能够以较低的成本实现。FasterViT在精度与图像吞吐量方面达到了SOTA Pareto-front。我们已经广泛地验证了它在各种CV任务上的有效性，包括分类、目标检测和分割。我们还表明，HAT可以用作现有网络的即插即用模块并增强它们。我们进一步展示了在高分辨率图像方面比竞争对手更快、更准确的性能。代码可从https://github.com/NVlabs/FasterViT获得。

1、简介

视觉transformer (vit)[18]最近在计算机视觉中很受欢迎，并在各种应用中取得了卓越的性能，如图像分类[38,17

了解本专栏

关注

3
点赞
踩
19

收藏

觉得还不错? 一键收藏
打赏
20
评论
YoloV8改进策略：基于分层注意力的FasterViT，让YoloV8实现性能的飞跃

这篇文章向大家展示如何使用FasterViT改进YoloV8，我尝试了几种方法，选出了三种效果比较好的方法推荐给大家。论文链接：https://arxiv.org/pdf/2306.06189.pdf本文设计了一种新的混合CNN-ViT神经网络族，名为FasterViT，专注于计算机视觉(CV)应用的高图像吞吐量。FasterViT结合了cnn的快速局部表示学习和ViT的全局建模特性的优点。新提出的分层注意力(HAT)方法将具有二次复杂度的全局自注意力分解为具有减少计算成本的多级注意力。
复制链接

扫一扫

专栏目录

评论 20

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

AI智韵 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。