YOLOv5、v8改进：CrissCrossAttention注意力机制

最新推荐文章于 2024-06-25 00:09:31 发布

陈子迩

最新推荐文章于 2024-06-25 00:09:31 发布

阅读量823

点赞数

分类专栏： yolov5/7/8/9系列独家改进文章标签： YOLO

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_45303602/article/details/132528400

版权

yolov5/7/8/9系列独家改进专栏收录该内容

61 篇文章 15 订阅 ¥49.90 ¥99.00

订阅专栏

超级会员免费看

目录

2. yolov5添加方法：

2.1common.py构建CrissCrossAttention模块

2.2yolo.py中注册 CrissCrossAttention模块

2.3修改yaml文件。

1.简介

这是ICCV2019的用于语义分割的论文，可以说和CVPR2019的DANet遥相呼应。

和DANet一样，CCNet也是想建模像素之间的long range dependencies，来做更加丰富的contextual information，来补充特征图，以此来提升语义分割的性能。但是和DANet不一样，CCNet仅考虑空间分辨上的建模，不考虑建模通道之间的联系。作者提出的模块，criss-cross attention module，针对空间维度上的建模，对于空间位置的一个点u，仅考虑建模和u在同一行或者同一列的其他位置的像素之间的联系。相比DANet，能减少很多计算量，但是不足的是，对一个点的特征向量，尽管有同一行或者同一列的其他像素信息作为补充，对于语义分割任务，contextual information仍然是稀疏的（sparse），因为语义分割更在意一个像素和它周围的一些像素的关系。针对这个问题，作者提出了recurrent criss-cross attention module，来建模一个像素和全局所有像素的关系。方式是通过重复criss-cross attention module来实现的。这些module也是参数shared的。

同样是建模空间维度的pixel-wise contextual information，CCNet的计算量相较于self attention&#

了解本专栏

超级会员免费看

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
打赏
1
评论
YOLOv5、v8改进：CrissCrossAttention注意力机制

这是ICCV2019的用于语义分割的论文，可以说和CVPR2019的DANet遥相呼应。和DANet一样，CCNet也是想建模像素之间的long range dependencies，来做更加丰富的contextual information，来补充特征图，以此来提升语义分割的性能。但是和DANet不一样，CCNet仅考虑空间分辨上的建模，不考虑建模通道之间的联系。
复制链接

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

陈子迩 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。